在最高院加快建设智慧法院3.0的大背景下,我院积极筹备实现科技法院、智慧法院,而庭审中的语音识别,更是智慧法院中一个重要的环节。
庭审中的语音识别,就是将法庭中法官以及当事人的发言自动识别成文字并形成文档的一个过程。也就是庭审过程中当事人各自所陈述的语音由法庭内设备传送给语音识别能力后即可获取到对应的文字内容,法官编辑文书,可以把所说的话转变成文字。
在以往传统的庭审过程中,需要书记员根据听到的信息进行记录,往往会出现庭审中因为节奏过快或者当事人语速太快而造成书记员记录不及时导致庭审中断或记录不详的情况。并且一般书记员的记录速度很难超过100字/分钟,以至于许多案件的节奏不得不依附于书记员的记录速度。
而语音识别系统在庭审中根据语音,自动与数据库进行比对、输出文字以毫秒计,一般庭审系统记录速度可以达到每分钟220-250个字,在系统较高的识别正确率下,书记员稍作修改即能完成。而在比较激烈的法庭辩论阶段,系统记录速度达到每分钟320-350个字,智慧庭审系统仍然能够及时识别,书记员只要对识别出的语句和标点符号进行简单修改即可。这样就可以大大的提高记录速度,可以使庭审的速度加快,节省庭审的时间,也节省了书记员的精力,不至于出现手忙脚乱的情况。
从现有的数据来看,庭审过程中在使用者普通话较标准且运用口头语言表述的情况下,系统识别的正确率能够达到90%以上,书记员可做到流畅记录而无需做过多修改。如果使用较拗口的法言法语以书面表述的方式朗读,则系统识别的正确率能够达到80%以上,但上述比例都与系统已录入的词库量有关。
因此,使用语音识别技术进行庭审是大势所趋,也是建设智慧法院3.0的需要。
但每一个系统都不会是100%完美的,就现有的语音系统而言,基本都是基于普通话语音库开发的,这就造成了在以方言为主的地区识别率不高的问题。如在本院,经过测试,方言的识别率仅仅能维持在60%左右。
好在现在的许多语音厂家都意识到这个问题了,语音识别系统也在向智慧系统靠拢,通过添加学习功能,在修改和识别的过程中,通过强大的数据库建立一个完整的地方方言语音库,可以让我们的庭审中识别率大大提高,让这个系统对审判效率的提高真正起到作用。