近日,

百度文心衍生模型PaddleOCR在GitHub上的Star数突破73.3K,首次超越谷歌旗下开源OCR标杆产品Tesseract OCR(73.2K),成为全球Star数最高的OCR项目。



Tesseract OCR诞生于1985年,最初由惠普实验室研发,2005年开源后由Google接手维护并持续迭代,是OCR领域延续近四十年的技术标杆,长期位居GitHub OCR项目Star数榜首。




此次被PaddleOCR超越,标志着这一标杆正在被新一代技术体系改写,也是大模型驱动下中国开源项目首次在OCR领域超越谷歌主导的标杆产品。



百度击败谷歌!PaddleOCR成GitHub最受欢迎OCR项目:中国开源首度登顶



PaddleOCR基于文心大模型训练而来,是文心大模型多模态能力的重要部分,支持超100种语言识别,用户覆盖160个国家和地区。

1月29日,新一代文档解析模型PaddleOCR-VL-1.5在 OmniDocBench V1.5 榜单中取得了全球SOTA成绩。



近年来,大模型成为OCR赛道增长的重要动力。Star History数据显示,PaddleOCR在GitHub上的Star自2024年起呈现爆发式增长。2025年以来,OCR更成为大模型厂商布局的重点方向,DeepseekOCR、HunyuanOCR、GLM OCR等产品相继发布。



此外,PaddleOCR同步升级服务能力:官网免费每日解析页数由1万提升至2万,用户还可通过OpenClaw直接调用PaddleOCR Skill,免费获取高精度PDF解析能力。



与此同时,PaddleOCR OCEAN生态联盟正式成立,面向核心开源贡献者、深度企业用户及全球平台伙伴开放,首批成员包括Hugging Face、Dify、RAGFlow、Cherry Studio、Milvus等全球平台伙伴,将共同推动OCR技术在更广泛场景中的应用落地。



ps.OCR(Optical Character Recognition,光学字符识别)是指通过光学设备(如扫描仪、摄像头)获取图像中的文本信息,再通过计算机算法将其转化为可编辑、可检索、可分析的数字文本的技术。简单来说,就是让计算机看见并读懂图像中的文字,实现 “图像文本→数字文本” 的精准转化。



自 快科技




更多阅读:





  • 2026年OpenClawGitHub星标数超24万,成最受欢迎开源项目




  • 《财富》:2023年全球人工智能创新者50强




  • Tidelift:调查显示26%的开源维护者年收入超1000美元




  • 中国互联网公司开源项目调查报告




  • CNCF:中国已成为全球第二大开源贡献国 CNCF项目的代码贡献接近100万




  • GitHub:AI开发者工具可带来价值1.5万亿美元的全球GDP增长




  • 莱顿高级计算机科学研究所:最新研究发现感染恶意软件的概率竟高达 10.3%




  • GitHub:仅10.7%的开发人员预计会在大流行结束后回到办公室




  • Github:研究显示女性“程序媛”写的代码更好




  • GitHub:研究表明女性开发的程序更受欢迎




  • GitHub上各类编程语言的热度:JavaScript领衔Java次之




  • GitHub:用户数达350万 软件库数量达600万




  • Github开发者突破300万




  • 密歇根大学:2015年11月美国消费者信心创7月来最高




  • 2021年Q1-2022年Q1网飞负债率(附原数据表) ​​​​