Tesseract.js 是一个基于 JavaScript 的开源 OCR(光学字符识别)库,使用 WebAssembly 将 Google 的 Tesseract OCR 引擎移植到浏览器和 Node.js 环境中。它可以在前端直接对图片进行文字提取,支持 100 多种语言(包括中、英、法、德等),适用于文档扫描、实时视频识别、移动端离线 OCR 等场景。
- Tesseract.js官网入口网址:http://tesseract.projectnaptha.com/
- Tesseract.js开源项目地址:https://github.com/naptha/tesseract.js
主要特性
- 跨平台:同时支持浏览器(通过 <script>、CDN、Webpack 等)和 Node.js 环境。
- 多语言:内置 100+ 语言的训练数据,中文(简体/繁体)识别效果良好。
- WebAssembly 加速:核心 OCR 引擎以 WASM 形式运行,内存占用低、识别速度快。
- 并行处理:支持 createWorker 多线程工作者,可在后台并行识别多张图片。
- 模块化:提供 tesseract.js-core、语言数据(tessdata)分离,便于自行托管 CDN,避免网络不稳定导致加载失败。
- 轻量化:最新的 v6.0.0 进一步压缩文件体积、优化内存管理,适合长时间运行的 Web 应用。
Tesseract.js 通过 WebAssembly 将强大的 Tesseract OCR 引擎带到前端,具备跨平台、多语言、低内存、高性能等优势。只需几行代码即可在浏览器或 Node.js 中完成文字识别,配合 createWorker 与本地语言数据即可实现离线、批量、实时的 OCR 需求。
数据统计
数据评估
关于Tesseract.js特别声明
本站千牛导航提供的Tesseract.js都来源于网络,不保证外部链接的准确性和完整性,同时,对于该外部链接的指向,不由千牛导航实际控制,在2025年11月10日 下午3:22收录时,该网页上的内容,都属于合规合法,后期网页的内容如出现违规,可以直接联系网站管理员进行删除,千牛导航不承担任何责任。
相关导航
Paperless-ngx是一款社区支持的开源文档管理系统,旨在将物理文档转化为可搜索的在线档案,从而实现无纸化办公。
IceCMS
冰激凌内容管理系统,实现MacWK资源站,社区图片视频圈子CMS,支持网页端移动端小程序适合做 资讯商城,社区论坛,聊天交友 社区,博客,圈子,论坛,图片,视频,社交。
链滴社区
一个以技术为核心的开源社区
Hyperswitch
一个支付处理平台,旨在为企业提供支付处理解决方案。一个开源的支付交换平台,支持多种支付方式和支付处理器的集成,旨在简化支付流程并提高效率。
BillionMail
BillionMail 为你带来开源邮件服务器、邮件订阅与邮件营销——完全自托管,开发者友好,无需月费。
Barba.js
一个轻量级且易于使用的 JavaScript 库,用于创建网站页面之间流畅、平滑的过渡效果 。它通过改变页面加载方式,使网站运行类似单页应用,减少页面加载延迟和 HTTP 请求 。
Spring.io
Spring 框架的官方网站,面向开发者的社区和资源平台,提供 Spring 框架的官方文档、教程、示例代码、API 文档、论坛、博客等资源,帮助开发者学习和使用 Spring 框架 。
chineseocr_lite
chineseocr_lite是一个开源的轻量级中文OCR(光学字符识别)项目,旨在提供高效、轻量级的中文文字识别解决方案。
暂无评论...

