12月4日消息 随着信息化、电子化在教育行业的普及,教师、公立学校、网校等,普遍面临将海量试题录入试题库的难题。每周每科动辄数万套试题的录入量,更是让网校教师苦不堪言。与此同时,教师还面临公式编辑难、录入效率低等难题。不过,随着海马扫描软件的上线,这些问题都将迎刃而解。
海马扫描是一款支持PDF、PNG、JPG等格式文件的文字识别、公式识别和智能排版的工具型产品,同时拥有文本校对、桌面截图等功能。它融合了OCR文字识别、图像目标检测、自然语言处理技术等AI技术,致力于为用户提高效率。
海马扫描由好未来集团AILab自主研发,应用了文字识别、公式识别等技术,其中文字识别已处于行业领先地位。
作为一款同时解决“公式+文本直接识别”的软件,海马扫描软件一上线,便吸引了教师、学生、出版社以及标注公司等用户的关注。据介绍,该软件上线前两周,便获得1000+注册用户。
海马扫描软件为何上线便获青睐,主要得益于其独特的产品优势和技术优势。产品方面,海马软件通过文本可编辑、抠图可编辑和表格可编辑三大高效编辑,为教学录题打造了从识别到录入的一体化闭环解决方案。
而在技术方面,海马扫描则依托OCR文字识别、图像目标检测、自然语言处理技术等AI技术,实现文字识别和公式识别一体化,并实现智能排版,使得教学场景下,文字识别更精准,试题录入更高效。
目前,海马扫描已在PC端官网和微信小程序同时上线。那么,海马扫描效果到底如何?首先,让我们来仔细了解一下海马扫描的小程序和PC端界面。
海马扫描微信小程序
打开微信,在搜索框中输入“海马扫描”,便会跳出海马扫描小程序软件。点击海马扫描,进入到小程序界面。
打开界面,我们会发现海马扫描界面相对简洁。主界面区,主要展示海马扫描和操作步骤。在界面底部区域,由三个功能按钮键组成:左下方的PDF识别按钮,居中的图片识别按钮和右下方的账户登陆按钮。
海马扫描小程序主界面
海马扫描与其他软件最大的不同在于,仅需输入手机号和验证码即可完成注册,省去了输入用户名、密码等环节,大大简化了登录程序。而根据使用规则,在不注册、未登陆的前提下,用户可以试用最多5次;注册登陆后,用户则可多次使用。
海马扫描小程序登录界面
点开账户按钮,进入到登陆界面,用户通过输入手机号码并经验证码通过,即可进行多次使用体验。
完成登陆后,我们点开中间的图片识别按钮,会往上弹出四个子导航菜单。自下而上,依次为拍照、相册、聊天记录和取消导航菜单。
海马扫描小程序图片识别界面
如果点开拍照,则会进入到拍照上传识别程序。如果点开相册,则进入用户手机图片库,进入图片上传界面。如果点开聊天记录,则跳转至微信聊天窗口。聊天信息中,仅展示图片信息,且图片信息按日期依次排列,方便用户快速寻找相应图片。
若点开PDF按钮,则跳转至聊天界面。点开聊天界面后,聊天过程中上传的各类历史文档如PDF文件、图片、Word文件以及Excel文件等则会按上传日期先后顺序依次排列。
海马扫描PC端程序
登录官网,按照安装指导完成下载安装后,注册进入海马扫描PC端主界面。
打开主界面,我们会发现,自上而下,依次为导航条、工具功能区和编辑器。其中,工具功能区包括七大功能:文件打开、文件导出、重新识别、截图识别、fx公式、绘制区域和文本校对。
而编辑器按功能划分,又分为三大块,自左至右依次为页面展示区域、图像区域和文本区域。
在页面展示区域,显示的是导入的单个或多个文件。当识别某个文件时可以看到在这个文件的左面出现一个红色的感叹号,说明文件正在识别。同时,页面展示区还自带右旋转90度、左旋90度、查看上一页、查看下一页和删除五个大功能,方便文件的微调、查看和删减。
图像区域主要展示扫描文件。该区域主要自带缩小、放大和收起三大功能按钮。而文本区域,则主要展示编辑的文本,具备查找替换、撤回和恢复三大功能。可以满足文字校对与替换,文字编辑与撤销等需求。
而从工具栏功能键来看,公式识别主要实现对图像区域内的公式进行截图和识别。通过公式截取与识别,形成LaTex代码,再通过LaTex代码的复制和在文本区的粘贴,再度转换为公式,从而实现由图像到文本的转换。
此外,工具栏功能键还支持多图添加、文本同时最多三行校对、文件绘制以及文件导出等功能。
基于海马扫描的上述技术优势,可以解决试卷扫描录入的多个痛点。下面就让我们实测一下:
场景一:图片文字和公式,实现一键解决
在试卷的录入过程中,尤其是数学试卷的录入,经常会遇到文字、数字、图形以及数学公式的混合录入。其中,又以数学公式录入比较棘手。
借助海马扫描的OCR识别功能和公式识别技术,该类试卷可以翻译成“文字+LaTex代码”,并经剪贴复制、粘贴以及LaTex等步骤处理后,快速完成试卷的录入。
为了方便,我们实际截取了一份试卷中的17小题进行实测。见图一。从图中我们可以看出,这道题有三道小题。如果人工录入,至少2分钟才能完成。
(图一)
拍照后,通过海马扫描小程序,点开图片识别中的照片识别,我们得到下述效果图(见图二)
图二:经海马扫描小程序图片处理后的实测效果图
通过图片识别后,识别后的内容既可以复制到剪帖板,也可以进行转发。假如复制到剪贴板,然后再粘贴至word文档中,将得到图三的效果。
图三:复制粘贴到word文档效果图
经过图片识别、内容剪切复制和粘贴三个步骤,用户可以快速将扫描件或者文字图片,转化为可编辑的word的文档形式。从而实现录入试卷的可编辑。这是在试卷或者文字录入中常见的情形。
如果试题中带有公式,通过海马扫描进行编辑,效果又如何呢?我们不妨进行实测,实测后效果见下图四。
图四:含有函数的试卷,经海马扫描图片识别效果图
从图四可以看出,经过海马扫描图片识别工具处理,试卷内容成功实现文字与公式的分离,且公式已经生成LeTex代码。下一步只需对LeTex代码进行处理即可。
场景二:图片文字识别,效率大幅提升
教师或者网校在进行语文试卷录入时,经常会涉及到大段的文字内容。如果遇到这种情况,海马扫描处理效果又如何呢?我们也进行一下实测,见图五:
图五:需要处理文字
从图五图片文字内容可知,这是分为四段,长度为700字上下的一页文字。如果采用传统的文字录入方式,按每分钟录入200字计算,至少需要3到4分钟才能完成全部录入。而通过海马扫描的图片识别功能,我们仅需1秒即可实现文字的全部转化。即使加上复制粘贴、编辑等环节,也可在半分钟内完成。因此,借助海马扫描OCR识别技术,文字处理效率将提高至少70%。如果按每页12元的成本计算,将可以节省成本8元到10元。
据官方透露,目前海马扫描文字识别能力已经覆盖7404个类(一个汉字是一个类),包含26个大小写字母和标点符号93个类。同时,该软件还支持印刷体中英文和手写体英文的文字识别。识别准确率方面,海马扫描对纯文字识别的精度约为97%。
图六为经过海马扫描照片识别处理后的效果图:
将图六内容复制到剪贴板,再粘贴到word文档,将得到图七的效果:
图七:文字经海马扫描图片处理后效果图
场景三:海量信息,快速处理
在日常教学中,教师常遇到的另一个难题是,家长们常会把学生写好的试卷发送在群里,要求老师批改。面对家长发过来的大量图片试卷,老师常头痛不已。不过,通过海马扫描软件图片识别中的聊天记录功能,不仅可以在海量聊天记录中快速找出不同学生家长发送过来的图片试卷,节省大量时间,还可以快速读取照片文字内容,并实现快速编辑和批改,然后将批改后的试卷发送给家长。
具体操作见图八、图九:
图八:海量聊天记录中的图片归集
图九:快速读取图片信息
场景四:PDF文件快速读取
在试卷录入题库的过程中,以网校为例,每周每科数万份的录入量,意味着巨大的工作量和大量的成本。权威数据显示,网校平均每页试卷的录入成本介于8元至12元之间。若平均每份试卷由6页则成,则意味着网校将为每份试卷付出至少40元的成本。
而借助海马扫描软件的PDF识别功能,通过将试卷扫描形成PDF文档,再进行PDF识别,将节省大量的人力成本和资金成本。
具体见图十和图十一
图十:PDF识别初始界面
图十一:PDF处理界面
场景五:公式识别,化繁为简
在数学试卷中,常见的数学公式常令人眼花缭乱,不仅浪费大量的时间,还容易出错。而海马扫描借助“公式识别”技术,可以快速实现数学公式的识别、转换和插入。
据介绍,目前,海马扫描的公式识别能力已经涵盖了中小学的所有公式。高中数学除部分结构复杂的公式暂时不能识别外,大部分公式均可实现识别。就纯公式而言,海马扫描的识别精准度已经达到92%。另外,对于一些结构和字符都异常复杂的公式,公司还在积极开发中。
从识别公式种类来看,据官方数据,目前海马扫描的公式识别准确率整体超90%。其中,对分式类公式识别准确率为93.0%,对根式及开方的识别准确率为95.8%,对上标的识别准确率为93.2%,对下标的识别准确率为89.9%。
效果到底如何?不妨进行实测。具体操作如下:
1、 PC端打开海马扫描软件,将目标文件导入。点击导航条上的工具,其中包含“识别”、“公式”“截图识别”、“绘制区域”、“查找替换”等子菜单,其中“公式”又有“公式识别”与“公式面板”子菜单。
2、 单击“识别”按钮,导入的文件左侧会出现!图标,说明正在进行识别,识别成功,图标消失。
3、 单击“公式识别”,图像区域会变暗,用鼠标框选要识别的公式。如图:
4、 框选过公式之后,会弹出如下弹窗:
单击“复制LaTex代码”,屏幕置灰,可通过Alt+Tab切换想要截取的界面,截图会自动导入海马扫描进行识别。(完)