我正在使用Microsoft OCR库进行阅读文本. Microsoft OCR库的运作良好.但是,我想阅读以下链接中给出的字符列表.ICT4U.NET/DATABASE/DATABASE-IMAGES/MICR.JPG .有没有办法可以训练OCR库读取以下字符或有一种允许阅读以下字符的语言. 解决方案 [这里的Microsoft OCR人员]我们尚未支持培训OCR来为您的用例定制它.但是,我们确实会积极关注StackoverFlow,以了解开发人员的需求,因此我们可以继续改善OCR引擎. 其他解决方案 我已经与Microsoft OCR合作了一段时间. 与Tesseract相比,它具有非常基本的功能. 例如,Microsoft OCR返回单词和行. 但是线条是胡说八道.将2或3个单词随机分组为"线",但它们不是真正的行.和"线"是完全无序的.在这方面,它比Tesseract差.您必须将每个单词的坐标列出并自己订购. Microsoft不会返回字符的矩形
以下是关于 ocr 的编程技术问答
有没有办法强制 zxing库仅扫描文本?我正在寻找离线(非云)解决方案,以在Windows Phone中扫描文本. 或 集成的Bing视觉成功地扫描了图像中的文本.有没有办法在我们的应用程序中调用相同的任务(例如Microsoft.phone.tasks)? 据我所知, 解决方案 没有本地.NET OCR发动机.从理论上讲,您可以使用任何用于WIN CE的OCR SDK(只要WP7基于它),但是实际上 - 我还没有看到任何工作解决方案,并且我见过的WP7的所有OCR应用程序都是基于云服务.如果您改变了有关Web API的想法,我可以指出一些准备去云解决方案. 其他解决方案 如果您正在寻找OCR解决方案,则可以使用此 post . 关于Bing Vision-尚无支持第三方开发人员.尽管有一个名为夏威夷的项目(是的,是基于云的),这可能是Bing Vision OCR的门户.
我一直在审查Office 2007 Modi OCR的替代品(OneNote的2010年解决方案的质量/结果都比2007 :-().我注意到Windows 7一旦安装可选的tiff filter OCR组件安装到 %programfiles%\Common Files\microsoft shared\OCR\7.0\xocr3.psp.dll 但我看不到任何API? 有人看到如何在c#? 中接口. 答案:找到解决方案,一旦安装了可选的tiff ifilter win7功能,我就可以使用code/exe在 http://www.codeproject.com/kb/cs/ifilter.aspx .另外,如果为.png和.jpg添加相同的[HKEY_CLASSES_ROOT.TIFF \ persistentHandler],则OCR也适用于JPG和PNG. 解决方案 其他解决方案 尝试使用我对海报的建议(放大图像,使用单独的过程): c#oc
我正在使用Tesseract在屏幕截图上执行OCR.我有一个使用tkinter窗口的应用程序.我已经搜索了多天,找不到任何特定示例,如何用python3.6在Windows平台上使用Pytesseract来调用Tesseract. . 这与此问题有关: 当我使用Pytesser运行Tesseract时,请隐藏控制台窗口 我只是对Python进行了编程2周,并且不了解上述问题中如何执行哪些步骤.我打开了pytesseract.py文件并进行了审核并找到了proc = subprocess.popen(命令,stderr = subproces.pipe)行,但是当我尝试编辑它时,我会发现很多错误,我不知道. #!/usr/bin/env python ''' Python-tesseract. For more information: https://github.com/madmaze/pytesseract ''' try: import Im
我正在尝试在Windows中训练Tesseract,为此我需要一个TIFF/BOX文件,并且我正在尝试使用JTessBoxeditor创建它,但它不接受图像作为输入.我也尝试过BoxFactory,但运行不正确.有人知道从图像创建对的最佳工具是什么? 谢谢 解决方案 如果您具有JTESSBoxeditor,则有Tesseract bin文件.转到JTessBoxeditor的 Tesseract-OR 子文件夹,并运行以下命令: tesseract.exe d:\ testocr \ testimage.tif d:\ testocr \ testimage batch.nochop makebox 它应该生成文件 d:\ testocr \ testimage.box . 然后在JTessBoxeditor中,转到Box Editor选项卡并打开图像.框文件自动加载,您可以检查一切是否正常并纠正可能的错误. 其他解决方案 我遇到了同样的问题,因为无法与
我知道这个问题已经在此站点上得到了回答,但是,我介绍的解决方案似乎都没有起作用.这是我尝试的: 给我的Python文件的所有权限 更改路径变量以指向我的Tesseract文件夹 以管理员的身份运行空闲,然后从那里执行文件 这个错误现在很困扰我,因此我无法进一步提前. 如果有帮助,这是我的代码: import pytesseract import sys import argparse try: import Image except ImportError: from PIL import Image from subprocess import check_output pytesseract.pytesseract.tesseract_cmd = 'C:\Program Files\Tesseract-OCR' c=pytesseract.image_to_string(Image.open('img.png')) print(c) 追
编辑: mftraining在unicharset中所有字符的标题中给出警告(因此不仅是f,而是a,b,c,d等),我如何创建这些原始人/configs? 我正在关注 this 教程 现在解决的上一个问题: - 错误:断言失败的战争:在文件中.... \ classify \ trainingsampleast.cpp,第622行无触发/分段故障 这是整个命令 +输出: - c:\训练> mftraining -f font_properties -u unicharset -o eng.unicharset eng.impact.box.box.box.tr警告:没有形状表文件:适合读取ENG.IMPACT.BOX.BOX.TR ... FONT ... FONT ID = -1/0,类ID = 1/103在样本0 font_id上> = 0 && font_id 我浏览了我在标题中可以找到的所有内容,介绍了unicharset中的所有字符(这并不多),所以不仅
因此,我的研究后听到的是,唯一可靠的免费OCR选项是现在,Tesseract文档很可怕,它们给您的只是一堆视觉工作室代码(对我在Windows上),从那里您独自在他们的API海洋中.您所能做的就是使用编译的EXE,然后在TIFF图像上使用它. 我至少期望简短的文档告诉您如何将其API呼叫至少用于使用OCR,但没有,但是,他们的文档中没有什么. Cuneiform:我下载了它,"伟大"的一切都在俄语中. :( 那些家伙真的很难举一个小例子,而是为我们提供了一堆无关的信息,大概90%的人无法到达,如果不开始小事,您怎么能到达那里,而他们都没有解释它! 所以我有很多API,但是如果没有任何解释,我应该怎么使用它?...也许有人可以为我提供建议和解决方案?我不是要一个奇迹,只是向我展示事情的工作方式很小. 解决方案 您可能已经放弃了,但是可能还有其他一些仍在尝试的人.因此,这是您需要从Tesseract开始的: 首先,您应该阅读有关Tesseract的所有文
我想创建一个应用程序,该应用程序在光标下(不仅用于文本字段),但我找不到如何做到这一点.使用OCR非常困难.我看到的唯一工作是替代性组件.他们支持一种"本地"方式,但我花了很多钱.现在,我试图弄清楚这种"本地"方式是什么(也许是钩子).任何帮助将不胜感激. 编辑: 我找到了一种方法,但它仅获得了控制的整个文本.任何想法如何从整个文本中仅获取光标下的单词? 解决方案 在最近版本的Windows上,将信息从一个应用程序收集到另一个应用程序的推荐方法(如果您没有目标应用程序当然)是使用 ui自动化技术. Wikipedia非常适合有关此信息的更多信息: Microsoft UI自动化 基本上,UI自动化将使用所有必要的手段来收集可以收集的内容 这是一个小型控制台应用程序代码,它将监视其他应用程序的UI.运行它并将鼠标移至不同的应用程序.每个应用程序对各种" UI自动化模式"都有不同的支持.例如,存在如下所示的值模式和文本模式. static void Main(st
我正在努力使用 tesseract-ocr 4.0 从图像中提取表格文本,并在保持数据对齐的同时将结果导出. 我想将所有空间保留在提取表中图像中的所有空间.但是,OCR跳过了很多领先和落后的空间,然后去除它们. 我有图像,在某些地方,桌子中出现空白空间.我已经使用保存Whitespaces 在Tesseract中的选项,但OCR仍然跳过了许多空白空间. 使用OCR提取时,是否有一种方法可以检测或保留所有空格? 还是使用表中使用距离测量的技术来检测空格? 将图像附加相同: 解决方案 我认为您应该将Tesseract升级到版本5,并使用" -c preserve_interword_spaces = 1"来保存空格.但是也许您必须进行后处理,因为输出可能无法满足您的期望. 编辑 您的问题类似于 this .但是由于我无法直接使用它,所以我对此进行了几乎没有修改.信用去伊格里尼. import cv2 import pytesseract fr
我们如何在Android应用程序中使用OCR Web服务 我使用此Web服务. 如何使用SOAP Base Web服务传递数据并获得响应. 如何通过嵌套XML标签的请求? http://www.ocrwebservice.com/service.com/services.com/services.com/services/services/services/ocrevbservice.asmx? op = ocrwebserviceregnize 请帮助.. 解决方案 实际上我得到了正确的答案.对于嵌套的请求,我编写了以下代码并起作用. SoapObject request = new SoapObject(NAMESPACE, METHOD_NAME); // Add input values to SOAPObject object - request request.addProperty("user_name", "test"
有人是否配置了 tesseract C ++ source-code成功地?它有32颗星,但我甚至坚持运行它,因为它是 当我尝试在视觉工作室中设置Tesseract的源代码时,它在OBJ文件中给出了错误,我该如何编辑这些文件,这对我来说没有任何意义.如果我不这样做,那么我应该在我的环境中成功运行它的方式有何不同(我的规格与 1. ERROR lnk2019未解决的外部符号_l_dnadiffadjvalues在函数中引用的_ptraconcatenatepdftodata pdfio2.obj 2. ERROR lnk2019未解决的外部符号_l_dnajoin在函数中引用_recogappend recogbasic.obj 3. ERROR LNK1120 2未解决的外部Tesseract.exe 我使用以下setps构建它: 1.从此 link . 2.下载 tesseract 和 Leptonica . 3.它包含一个build_tes
我有一个问题,我必须阅读监视摄像机录制的视频的录制时间. 时间出现在视频的左上角.下面是指向显示时间的区域的屏幕抓取的链接.另外,数字颜色(白色/黑色)在视频期间不断变化. http://i55.tinypic.com/2j5gca8.png 请指导我朝着解决这个问题的方向.我是Java程序员,因此更喜欢通过Java进行方法. 编辑: 感谢Unlillbilly的评论.我看过Ron Cemer OCR库,其性能远低于我们的要求. 由于OCR性能少于所需比较后的概率结果. 所以我正在寻找一个很好的图像比较库(我可以使用一个可以使用命令行运行的非Java库).同样,有关上述方法的任何建议都会非常有帮助. 解决方案 似乎您在这里不需要完整的OCR. 我认为这些数字在图像中始终处于相同的位置.您只期望每个知识位置(黑色或白色)的数字0-9. 一个简单的模板在每个位置与每个数字匹配(每种颜色的10个数字的20个模板)非常快(实时),应该给您非常准确的
我使用OCR来识别图像中的文本.我使用来自 mediaStream .这是负责的代码: function getBlobFromMediaStream() { const videoTrack = mediaStream.getVideoTracks()[0] const imageCapture = new ImageCapture(videoTrack); return imageCapture.takePhoto().then(blob => { if (!blob) throw "Photo could not be taken"; return blob; }) } 太糟糕了,此API在许多浏览器上不起作用(Firefox,IE,Safari).有可以使用的替代方法吗? 解决方案 您可以用HTMLVideoElement和a HTMLCanvasElement. 进行后备 首先检查您的浏览
我正在尝试编码一些我已经拥有的序列号的PDF(Gmail),将其保存在驱动器中,获取OCR并阅读内容. 第一步没有问题,第二步是通过以下代码管理的,但是最后两行用 documentapp getText()不起作用: var serial = "123456789"; var ret = DriveApp.searchFiles('fullText contains "' + serial + '"'); if (ret.hasNext()) { var file = ret.next(); var n_blob = Utilities.newBlob(file.getBlob().getDataAsString(), MimeType.PDF); n_blob.setName(serial); var n_file = DriveApp.createFile(n_blob); var rt = DocumentApp.op
我在Windows机器上使用Python 2.7,Pytesseract-0.1.7和Tesseract-ocr 3.05.01. 我试图为韩语和俄罗斯语言提取文字,而我提取的是很肯定的. 现在,我需要与从图像中提取的字符串和字符串进行比较. 我无法比较字符串并获得正确的结果,它只是说不匹配. 这是我的代码: # -*- coding: utf-8 -*- from PIL import Image import pytesseract import argparse ap = argparse.ArgumentParser() ap.add_argument("-i", "--input", required=True, help="path to the image") args = vars(ap.parse_args()) img = Image.open(args["input"]) img.load() text = pytesseract.im
如何拍摄两张图像并比较它们以查看它们的相似之处? 我不是在谈论使用MD5比较两个精确图像.我要比较的两个图像将完全不同,并且有时可能不同. 以口袋妖怪卡为例: 我将扫描每张卡的高清图像.我希望用户能够用手机拍摄他们的口袋妖怪卡的照片,我希望能够将其与我的扫描图像进行比较,然后确定他们拍了一张照片. . 该处理不必直接在手机上进行,而是一个选择,但是请注意,我的知识在某种程度上受到编程语言的限制(仅限于PHP/Java/Android).我正在使用的服务器是我自己的Ubuntu服务器,因此如果有帮助,我确实可以从PHP访问EXEC命令. 起初,我认为有人会在此之前做过这样的事情(比较两张图像).我尝试使用一个与Imageik一起使用PHP使用一个示例,发现我声称可以做我正在尝试的事情(使用compareImages()),但根本没有用.似乎没有太多(如果有)关于做类似事情的文档,这就是为什么我如此陷入困境的原因.我要寻找的只是向正确的方向推动. 我的第二个想法是