Tesseract.js 是一个基于 JavaScript 的开源 OCR(光学字符识别)库,使用 WebAssembly 将 Google 的 Tesseract OCR 引擎移植到浏览器和 Node.js 环境中。它可以在前端直接对图片进行文字提取,支持 100 多种语言(包括中、英、法、德等),适用于文档扫描、实时视频识别、移动端离线 OCR 等场景。
- Tesseract.js官网入口网址:http://tesseract.projectnaptha.com/
- Tesseract.js开源项目地址:https://github.com/naptha/tesseract.js
主要特性
- 跨平台:同时支持浏览器(通过 <script>、CDN、Webpack 等)和 Node.js 环境。
- 多语言:内置 100+ 语言的训练数据,中文(简体/繁体)识别效果良好。
- WebAssembly 加速:核心 OCR 引擎以 WASM 形式运行,内存占用低、识别速度快。
- 并行处理:支持 createWorker 多线程工作者,可在后台并行识别多张图片。
- 模块化:提供 tesseract.js-core、语言数据(tessdata)分离,便于自行托管 CDN,避免网络不稳定导致加载失败。
- 轻量化:最新的 v6.0.0 进一步压缩文件体积、优化内存管理,适合长时间运行的 Web 应用。
Tesseract.js 通过 WebAssembly 将强大的 Tesseract OCR 引擎带到前端,具备跨平台、多语言、低内存、高性能等优势。只需几行代码即可在浏览器或 Node.js 中完成文字识别,配合 createWorker 与本地语言数据即可实现离线、批量、实时的 OCR 需求。
数据统计
数据评估
关于Tesseract.js特别声明
本站千牛导航提供的Tesseract.js都来源于网络,不保证外部链接的准确性和完整性,同时,对于该外部链接的指向,不由千牛导航实际控制,在2025年11月10日 下午3:22收录时,该网页上的内容,都属于合规合法,后期网页的内容如出现违规,可以直接联系网站管理员进行删除,千牛导航不承担任何责任。
相关导航
专为终身学习者定制的编程知识社区
Redmine
Redmine 是一款基于 Ruby on Rails 框架开发的开源项目管理和问题跟踪工具,广泛应用于各种企业和团队,尤其是软件开发和技术团队 。
Anime.js
Anime.js 是一款轻量级、高性能的 JavaScript 动画库,凭借其简单而强大的 API,成为现代 Web 开发中实现复杂动画效果的首选工具。
Crawlee
Crawlee 是一个开源的网络爬虫和浏览器自动化库,广泛应用于数据收集、内容监控、SEO 优化和自动化测试等领域。
SyncTV
SyncTV 是一个开源的同步观影平台,支持多人远程同时观看电影、电视剧以及直播内容,并提供实时聊天、弹幕等互动功能。
Flutter
Flutter 是由 Google 开发的免费开源 UI 软件开发套件(SDK),旨在帮助开发者使用同一套代码同时构建 iOS、Android、Web、桌面等多平台的高性能原生应用。
魔搭社区
中文AI模型开源社区
mo.js
mo.js 是一个专注于提供丝滑动画和特效的工具,旨在为用户带来卓越的视觉体验。
暂无评论...

