智通明识OCR网站Zpdf(临时名)内测及活动介绍

1. 网站功能介绍

  • PDF解析
  • 手写图片识别
  • Markdown翻译(测试版)
  • PDF保留排版翻译(测试版)
  • 格式转换

1.1. PDF解析(核心功能)

OCR 技术的核心是文本识别,而 PDF 作为常用文档格式,其内容往往难以直接二次编辑。Markdown 则是一种简洁高效的标记语言,不仅语法轻量,还能原生支持代码块、LaTeX 公式等专业场景的排版需求。对于科研人员和学生来说,将 PDF 通过 OCR 解析为 Markdown后,既能更精准地检索关键信息,无需逐页翻阅,也能自由地添加批注、整理笔记或进行二次创作,更能在与大语言模型(LLM)交互时,让结构化的文本帮助 AI 更完整、准确地理解文档核心,提升问答或分析效率。而我们的项目核心目标,就是实现 PDF 到 Markdown的高效、精准解析。利用视觉语言的模型对科技文档的适应性,我们设计了一套高效、准确的解析框架,并对模型进行微调以提高任务适应性和稳定性。此外,我们支持用户可以凭借个人需求选择保留原始表格图片或Markdown格式的输出。并且,用户可以通过勾选翻译选项来自由选择输出“原文、译文、双语对照”的不同组合。真正实现了文本解析自由。

1.2. 手写图片识别

手写图片识别能高精度解析课堂手写笔记,直接整理成规范的 Markdown 文本。对于不熟悉 LaTeX 编辑的用户,截图 + 识别的极简工作流可大幅提升效率 —— 无需繁琐查询 LaTeX 语法规则,也不用花费精力打磨提示词,就能达成预期效果。只需上传待解析图片,即可直接获取无需二次调整、所见即所得的 Markdown 成品。

1.3. Markdown翻译(测试版)

Markdown 翻译的核心难点的是,大语言模型(LLM)翻译时易受长上下文影响,出现效果衰减与幻觉干扰问题。我们创新性提出新型翻译框架,经大量实测验证,已精准攻克这一长上下文痛点。

1.4. PDF保留排版翻译(测试版)

PDF保留排版翻译的难点在于如何在提取文本内容的同时,精准还原原文的格式、布局、图表位置等非文字信息。传统方法往往依赖规则匹配或固定模板,适应性差,易出现错位、丢失样式等问题。利用目标检测算法和视觉语言模型,我们设计了一套高效、准确的识别框架,能够在解析文本的同时识别并保留版式结构,实现翻译内容与原排版的无缝融合,比传统框架更稳定、适应性强。

1.5. 格式转换

众所周知,Markdown 是一种功能丰富且轻量便捷的编辑语言。依托这一特性,我们可将其高效转换为 Word、HTML、PDF 及 LaTeX 等多种格式,充分适配不同办公习惯用户的 PDF 解析需求。

2. 内测限时活动

  • 内测期间,每日签到可以获得100积分,正式上线后恢复10积分/天
  • 正式上线时,按照内测期间消费的最高会员等级发放一次积分(过期也可)
  • PDF翻译功能临时定价为1积分/页,正式上线将替换最新模型、恢复原价2积分/页

3. 积分定价系统及会员制度

3.1. 积分定价

  • PDF解析:2积分/页,带翻译3积分/页
  • 手写图片识别:2积分/页
  • Markdown翻译:2积分/万字符
  • PDF保留排版翻译:2积分/页,内测期间1积分/页
  • 格式转换:1积分/次,会员免费

3.2. 尝鲜包及加量包

  • 尝鲜包:4.9元,500积分
  • 加量包:19.9元,3000积分,只有会员可以购买

3.3. 会员制度

  • 普通版:19.9/月,3000积分/月,199.9/年
  • 高级版:39.9/月,8000积分/月,399.9/年
  • 团队版:199.9/月,50000积分/月,1999.9/年

3.4. 会员制度必读说明

3.5.1. 积分发放规则

**月付:**共发放 1 次积分(购买时立即发放) **年付:**共发放 12 次积分(购买时发放 1 次,之后每 30 天发放 1 次) ※ 默认一个月为 30 天,一年为 360 天

3.5.2. 多等级会员

购买不同级别的会员时将同时生效,积分叠加获得更多权益。 例如:同时拥有普通版和高级版,每月可获得 3000 + 8000 = 11000 积分

3.5.3. 剩余积分与会员时长

剩余的积分可以积累,不会过期。 会员时长可以叠加,续费将延长到期时间。

3.5.4. 加量包购买限制

只有会员状态才能购买加量包(一次性 3000 积分)。 加量包不影响会员有效期,仅提供额外积分。