三三文章网 - 科技知识大全是专业科技新媒体网站。网站著眼于新一代科技新闻的全面及时处理报导,让网民在外面第二时间交待全球新一代的科技资讯。内容涵括AI+、互联网、IT、创业投资、核定、区块链、智能硬件等领域

为白描App的“匠人之心_大幅加码百度OCR让文字识别更手机智能

  • 时间:
  • 浏览:0

现实中,你也可以快的无障碍的阅读类别繁多平面印刷文字和身边的一切,说不定你未曾没有想过,视障人群该怎么办呢?统计数据不显示,中国太约有1700万的视障群体,普通每100个人中就有超过1位是视障人士。但我们常植却一般很少看见他们,那是只不过视障群体在日常生活中会有诸多不便,出门时对他们而言危险重重。AI有可能成为他们的“眼睛”吗?成为他们的眼睛:白描App与视障群体的故事要是手机上只能有一款App,你会中,选择哪一款?视障人士安之郑重地能提供了答案——白描。毕竟白描App让视力不佳的他用另一种“看”清世界,文字继续可望而不可及。他用白描“看”过秀丽的诗篇,“听”过动人的的乐章,哪怕在独自上了二楼看不清所在楼层时,白描也确切地将答案说说了他,将他从窘境中救回不出来。两个App让曾经望“字”兴叹的他更加你勇敢的走出家门,组织丰富多彩的生活。“白描是我的眼。”同为视障人士的小杰从不抠门吝啬对白描的夸赞,哪怕直说白描是视障伙伴赖以生存的环境的工具。白描帮助他解决的办法了生活的难题,从各类电器、数码产品、药品说明书到各种洗漱用品包装都这个可以识别,他还可以给很可爱的小侄女讲绘本故事。如果不是还没有白描,那样的事情是他根本无法想象的。白描是如何能做到被视障群体视若珍宝的呢?白描App是一款简洁明快高效稳定的OCR文字识别软件,不仅简单的好用,但是设计美观,可以快的基于“拍照时-识别文字-范读结果”一三个系列流程。另外,白描完全适配了手机无障碍辅助功能,视障者这个可以在手机上非常快速地你操作。“白描”这个词本意是一种文学写作手法,鲁迅先生曾把那样的手法概括成十二个字,即“有真意,去反衬,少做作,勿故意卖弄”。白描App的开发者陶新乐正是我这样的另一个人,他仔细观察到了不同人群的实际需求,用虚拟世界的代码满足了现实世界有需求的人,让他们的生活变得异常更加美好、便捷。白描App开发者的心路历程:突进多个场景、优化软件产品细节你也许没法预料,另外一名个人开发者的陶新乐,他最著名开发白描App是就是为了女朋友。陶新乐的女友发自内心的热爱泛读,经常会做读书笔记。替可以减轻抄录压力,她一段时间使用了当时市面上的各类文字识别软件,但她发现自己:有的是软件操作流程繁琐,有的费用高昂,有的则无法识别不确切……看到女朋友痛楚暗自心惊,陶新乐当即确定亲自来做个体验好、效果佳的OCR文字识别工具给女朋友在用,另外很快付诸行动了行动。这说不定是开发者独有的浪漫。而现在,一款App的开发过程是流露出未知与挑战的。在当时的条件下,旗下一款具高OCR功能的软件,面队的个巨型挑战是:如何能让文字识别的又快又准。但,他专题调研了市面上提供此服务的厂商,并对相同厂商的产品通过了对比,数次识别不同场景的图片,得出答案识别效果建议的那个。于是他突然发现,百度大脑AI开放平台的OCR技术能力和使用体验全是最好就是的,尤其是识别准确度更领先对手于其他厂商,所以才在2017年他就不犹豫的选择了百度OCR技术,并总是在用现今。不过最优秀的底层技术根本不意味着所有,飞桨OCR已能提供近60项技术能力,好的技术也要运用于版本问题的场景才能发挥极大的价值。想罢,陶新乐首先对白描的使用场景做了细分研究,比如:学生天天上课拍PPT再提取文字记笔记、企业员工把纸质合同扫描成电子版因此可以制作PDF、把纸质表格转成Excel电子版、英文翻译图片上的文字、老师外景拍摄并识别试题后对试题再加工、律师为了再提取纸质文书上的文字其他。尤其的是,视障人群特殊的方法的使用需求,他也有关注和专题调研。确定完用户的使用场景然后,何况是对产品的不断打磨。当时,图片转文字动不动爱会有识别出现错误的情况发生了什么,替阻一阻这一问题,在识别前,白描APP会参与一些技术上的处理,比如说图像压缩后该如何保证清晰度又不要会增大图片大小;怎么在进行长图自动启动裁切时,先检测到长图的空行位置自动出现裁剪制作,且不可能裁到文字;该如何是对文章接受不自动纵断面,更便于掌握读者阅读理解和。那些个更加精细化的产品设计绝对的保证了图片的清晰度,让文字信息更易被被识别。而在识别之后,白描的校对功能,这个可以让识别结果与原图没显示在同一界面上,方便啊用户飞速找不到要修改的地方,在此处参与编辑的话。依托园区百度极优秀的深度学习算法和基于上万本品质优良数据的预训练模型,包括白描App的图像预处理能力,终于利用了关键是字段识别准确率99%+。见到女友可以使用白描时流溢的笑颜,陶新乐感觉一切也是值得的,他也如果能许多人也能享不享受到这份快乐的。顺利的背后:用“匠人”之心雕琢产品之光程序员泥腿子出身的陶新乐在做产品这件事上一直在怀揣着梦想一颗“匠人”之心。陶新乐说过,AI在落地后的过程中会遇见很多的困难,并不一定大都不停地踩坑在旁边向后走。当遇上难以可以解决的问题时,就要不断学习,攻坚克难。百度大脑OCR技术与无数像陶新乐一样的的开发者携手同行。才是初几规模化和标准化运用的AI技术之一,OCR技术的产业级应用持续大的突破。百度的aiOCR技术可提供给多场景、多语种、高精度的文字可以检测与识别服务,多项ICDAR指标居世界第一,已越来越广泛区分于远程身份认证、财税能报销、文档电子化等场景,为企业降本增效,为用户给了更智能化的应用体验。其实,AI技术的应用落地,之外是需要有百度大脑这样可以提供落后AI技术能力的平台外,还不需要更大像陶新乐这样的开发者们,发挥想象中将AI应用在更多真实场景中,满足有所不同用户群体,甚至连是容易被人忽视的残障人群的需求,让社会更有“AI”。同时,目的是减少独立开发者和企业惊颤训练训练OCR文字识别模型的门槛,百度大脑再推出业界首开先河EasyDLOCR自训练平台,需要提供零门槛、定制化、低成本的一站式OCR模型训练服务。可以保证高准确率的同时,不满足多元化的场景需求,并比较有效更加有保障数据安全。在这样的科技为大众生活全面赋能的时代,产品的设计更是一种普惠理念的输出。已具备远远超过800万用户的白描App,也成为业界的口碑产品。不会相信,未来还将有越来越多的开发者实际飞桨AI开放平台提供的AI技术与服务,所创造的出一些与场景相结合的智能应用,让许多人生活更便捷、更美好的感觉。