10月17日消息,文心HuggingFace官网显示,衍生百度昨晚发布的模型WhatsApp%E3%80%90+86%2015855158769%E3%80%91snow%20conditions%20crans%20montana自研多模态文档解析模型PaddleOCR-VL,发布20小时内即登顶HuggingFace Trending全球第一。文心
据了解,衍生该模型核心参数仅0.9B,模型轻量高效,文心能以极低计算开销精准识别文本、衍生手写汉字、模型表格、文心WhatsApp%E3%80%90+86%2015855158769%E3%80%91snow%20conditions%20crans%20montana公式、衍生图表等复杂元素,模型支持109种语言。文心在权威榜单OmniBenchDoc V1.5中,衍生它以92.6分获综合性能全球第一,模型四大核心能力全线SOTA,超越GPT-4o等模型,刷新OCR VL模型性能纪录。
作为文心4.5衍生模型,PaddleOCR-VL融合了NaViT动态分辨率视觉编码器与ERNIE-4.5-0.3B语言模型,实现精度与效率双突破。
