lch
发布于 2026-03-31 / 0 阅读
0

百度文心衍生模型PaddleOCR登顶GitHub Star OCR全球第一

3月30日,百度文心衍生模型PaddleOCR在GitHub上的Star数突破73.3K,超越谷歌 Te sseract OCR,成为全球Star数最高的OCR项目。

谷歌Tesseract OCR诞生于1985年,最初由惠普实验室研发,2005年开源后由Google接手维护并持续迭代,是OCR领域延续近四十年的技术标杆,长期位居GitHub OCR项目Star数榜首。此次也是中国开源项目首次在OCR领域超越谷歌,实现GitHub Star数第一。

PaddleOCR基于文心大模型训练而来,是文心大模型多模态能力的重要部分,支持超100种语言识别,用户覆盖160个国家和地区。

1月29日,新一代文档解析模型PaddleOCR-VL-1.5在 OmniDocBench V1.5 榜单中取得了全球SOTA成绩。

此外,PaddleOCR同步升级服务能力:官网免费每日解析页数由1万提升至2万,用户还可通过OpenClaw直接调用PaddleOCR Skill,免费获取 高精度 PDF解析能力。

与此同时,PaddleOCR OCEAN生态联盟正式成立,面向核心开源贡献者、深度企业用户及全球平台伙伴开放,首批成员包括Hugging Face、Dify、RAGFlow、Cherry Studio、Milvus等全球平台伙伴,将共同推动OCR技术在更广泛场景中的应用落地。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 百度
    百度
    +关注

    关注

    9

    文章

    2389

    浏览量

    95220
  • 模型
    模型
    +关注

    关注

    1

    文章

    3822

    浏览量

    52276
  • GitHub
    GitHub
    +关注

    关注

    3

    文章

    489

    浏览量

    18763

原文标题:PaddleOCR登顶GitHub Star OCR全球第一!

文章出处:【微信号:baidu_2000,微信公众号:百度】欢迎添加关注!文章转载请注明出处。