服務(wù)內(nèi)容全部包含:
提取PDF關(guān)鍵維度的內(nèi)容,生成結(jié)構(gòu)化的段落。
對(duì)字符的字體和樣式做聚類分析,生成樣式和PDF高度一致的HTML頁面。
生成html高度還原PDF。
服務(wù)優(yōu)勢(shì):
1. 利用PDF解析得到的字符,線,矩形框,文本行等元素的位置信息做聚類分析,精確定位表格,提高了解析的準(zhǔn)確度。
2. 通過語義分析得到關(guān)鍵維度的內(nèi)容,以HTML形式展示時(shí),保留關(guān)鍵樣式信息,和PDF原文保持高度一致,改善了閱讀體驗(yàn)。
服務(wù)前需客戶提供的信息:
PDF樣例需要覆蓋用到的所有PDF基本排版。
需求需要明確HTML還原哪些元素,比如是否需要樣式信息等。
解析性能要求比如錯(cuò)誤率要求。
文字轉(zhuǎn)換軟件文字識(shí)別軟件B/S定制開發(fā)二次開發(fā)源碼交付成品購買