科研人员经常需要阅读文献,看很多的PDF电子书,一些好的文献或者电子书常是扫描版的,不能自由复制,打字又比较麻烦。要想快速复制文字的话,常用到的就是OCR软件。
OCR(OpticalCharacterRecognition),也叫光学字符识别,是指对文本资料的图像文件进行分析识别处理,获取文字及版面信息的过程,最先由德国科学家Tausheck在年提出来。
OCR软件衡量的指标有很多,如文字识别速度、软件用户界面、稳定性、易用性等等,但最重要的指标还是识别准确度。
现在市面上常用的OCR软件有大名鼎鼎的ABBYYFineReader,识别率高,但是软件体积太大,显得臃肿,最重要的是要钱,破解版也比较难找。还有就是天若OCR,识别度还可以,但是部分功能也是收费。
今天推荐一款开源免费的OCR软件——PandaOCR。
软件已在git-hub上开源。 推荐几个好用的浏览器插件 -04-16 CopyTranslator——复制即翻译的外文辅助阅读翻译解决方案 -04-14 昨天晚上翻遍了全部的脚本网站,我又找了这16个适合你的脚本 -04-13 给科研人员推荐的13个油猴脚本,让你的效率提升十倍 -04-03 推荐一个批量下载网易云课堂、中国大学、爱课程、学堂在线课程的软件 -03-30
R语言统计与绘图
长按
转载请注明:http://www.0431gb208.com/sjszyzl/735.html