网站公告: 书记员技能培训班火热报名中!高级速录直通班、周末班、灵活授课班同步招生,咨询电话:0311-80699304 ! ...
地址:石家庄市桥西区海悦国际写字楼F座617室
电话:0311-80699304 0311-80801119
      
联系人:黄老师 施老师 刘老师
邮箱:947267742@qq.com
qq qq

新闻资讯 您当前的位置:首页 >> 新闻资讯

对话E迅速录创始人杨议老师 第4集

时间:2018-5-22

嘉宾:杨议老师

速录/字幕/文稿:味道
主持/拍摄/剪辑:晓览

引 言

杨议老师

如果你是因为担心被替代而不敢去学习速录技术,其实大可不必,因为那样值得你担心的可能远远不止速录这么一个技能,翻译、编辑、会计、教师、警察……甚至编程本身,你会发现周遭你可能去学习的技能基本都是这样的结果。而那些低端很难被人工智能所替代的工作,你又不会愿意去做;高端不会被替代的那些,你又做不了。生活在继续,E迅速录也在砥砺前行,让自己具备更多能力并用它们产生更多创造性的价值,才是值得用心的地方。我不会把“担心”放在“被替代”这件事情上,不会因为“担心”它未来被替代而放弃当下技艺傍身的机会。

本集文字稿:

杨议老师:我们并不要觉得普通话不标准,就跟语音识别无缘,这是个误解。但现在大家都会发现一件事情,这个数据是无限的,我们说话的特征可能很多是一样的,但是你跟外国人说话的特征可就不一样了,而且最容易看见的差异是什么?你说话的特征跟老人和小孩说话的特征绝对是不同的。在数据里你能看到,如果一个语音识别的模型很适合大部分人,你去找一个老人说话,或者找一个小孩说话是很难识别的,这也是跟数据有关,如果它全部都是用小孩数据喂的,可能这个东西就很适合于小孩。

这就有一个问题,我们拿它去做实际的使用时,我们怎么知道它是适合哪个呢?难道还要求提供的服务的公司说一定给我做一个适合我的?这就做不到了。它到一个大众普遍性的应用来说,能够达到像速录师做准确的记录来说,还是有很大的难度。

同时,语音识别有一个很大的缺陷,语音识别目前的模型其实是分了好几段解决的,从声学模型过来把声音采集,然后把噪音去掉,或者是混合特定噪音进去,它有不同的处理方法。到模型里面去进行识别,识别出来的实际上是音,这个音不是拼音,它是一大堆的哈希值而已,通过神经网络去对它神经网络那一堆内容。然后到后端还要做校正处理,流程挺长的,通过这一堆处理,才看到它显示出来的那些结果。

这个东西,目前我们觉得语音识别做的典型特征还是在做“音到字”的这么一个工作。速录师不是一个机器,速录师是人,人有人本身的特征。其实我们完成这个事,关心到底完成的任务、结果是什么,我们大部分的时候并不是需要从音到字的结果,这段是很讨厌的事情,语音识别现在很头痛的一件事,实际上拿到一个文章的时候,并不是希望它每句废话都在。因为它是音到字的一种计算方法,也给语音识别的结果带来很大的歧义性,比如说我们说话的时候突然断掉了,我上面说了半句话,中间插了一句,后面又说了半句话,它这样是没法处理的。一个人说话如果有口音,这个还是小事,但是如果一个人说话口吃,吃字那就完蛋了,那个字就没了。

原来探讨过英文识别更容易还是中文识别更容易,这个很难讲,中文识别里面有它简单的地方,汉字是单音节的字,发音很清楚。

晓览:但同音字就很多。

杨议老师:对,它不好的地方就是同音字多。英文每一个字歧义性都不大,它很容易吃字,有的时候音节完全就没有了。我都不用说普通的英文地方话,比如《朗文词典》第一页的“a”,你看它后面有几个注音,have、had这样很简单的词,在《朗文词典》里面列出好几个注音,其中有很多是因为偷懒。那天我和叶云谈这个事情,他说这就是懒人英语,一个have就给你“v”的音。它就是这样发音的,对识别来说这就产生了很大的歧义性,它不是识别不出来,能识别出来,这跟喂数据的量有关系,但这样难度就大了。所以技术的难度哪个大哪个不大,我觉得不太好说,要识别这种东西,你有足够大的语言训练好的东西、校对好的数据,在技术上是这么处理的。

说到语音识别,很多朋友都会关心一件事情,都有语音识别了,速录师是不是可以被代替了?速录师其实是完成综合性的目标,速录师是要给你一个你能用的结果,语音识别就是给你的音到字,如果你的需求仅仅是音到字,我就把这些字百分之多少的内容给你。

晓览:平时在手机用语音识别聊天时,错一两个字的时候,也没问题。

杨议老师:也没什么问题,很多时候错的基本上是同音字,只要你说话的时候可以控制住自己,不要半句话半句话说,只要不吃字,不要出现口吃的现象。其实现在语音识别是可用的技术,到了一个很不错的状态,要它完成速录师的专业工作,还是有很大的难度。

再给大家举一个重要的点,一个速录师如果打错了,你自己作为录入人员打错了会有感觉的,如果敲错了,如果发现那个字选错了都会有感觉的。语音识别不知道自己错在哪,它需要你还要花同样的时间去确认。

晓览:我们在速录的时候,在打的过程中打错时可以做一个标记。

杨议老师:很多的时候即时改了,这是一种。第二种,你自己读自己的文字时候,校对效率是很高的,自己知道自己大概错在哪。语音识别的结果其实挺难,最近在做这个,大家都用了,校对起来难度挺大的,为什么?语音识别不知道自己哪错了,你要知道它在哪错了,你需要把所有的东西都看一遍,不管他吹多少,不管他说多少,从技术的极限来说,你永远不是100%。从我们现在看到的,实验室里的数据,比如97%、98%,在实际的使用过程中达不到这么高的,尤其是在句正确里面达不到的。尤其是在句正确里面错的句子,95%可能是5个字,那错的5个字分布在很多地方,5个字在五句话里面了,这个时候你要找出那5%来,你付出的代价其实并不小,你还是一样要听一遍。

职业工作的速录师是要同步完成一个结果的,人大开会开完以后同时要把稿子给客户。该去做新闻的做新闻,甚至是同步投影完要把文稿完成。如果你要再去校对一遍,时间就更长了。

最可怕的一件事情,尤其是在法院碰到的问题,法院在做信息化建设,很多法院在上这样的系统,我们也探讨这些事情。如果你可以省掉了书记员,你用这套系统很值得;如果你确实是没省掉这些人,我不知道这样做了有多大的意义。如果在法院这些特定的岗位上,公司也好,有一些特定的会议,如果就是要节省成本、节省人,你一定要去完成这个任务,它才有意义。不能说我给了你一个工具,我还需要原来同样的成本再附加到上面去才能完成,那就没有意义了。我需要一个书记员再花那么多的时间同步去校对,就没有意义了。

我当时给司法系统的建议是,如果你们要那样去做,把能做的一类案件划出来,就不需要书记员了,这样就提高效率了,这样也划算了,成本也节省了,人也不用那么累。有些东西语音识别就不可能完成的任务,就不要让语音识别干这些事情了,就是人干的。这个人来了就是乡下人,说话就是磕磕巴巴、前言不搭后语的,那些东西记录下来就没法听了、没法看了,人都听不清楚,就更别说机器了,更听不懂。就算你听懂了每个字都对了,你拿出来也不能用。这也是面临的一个现实问题,也要分情况。

我们自身也是技术公司,也在不断地使用这些新技术,有些新技术我们不可能自己去开发,但我们是使用者,我们也希望这些技术不断地发展,有更多的选择来帮助速录师降低工作强度。现在正在做这一件事,我们不会排斥新技术,我们会用更理性、更准确地去把握现在的技术状态,应该做到什么样的程度,是合适于现在的成本要求。为客户、速录师、技术开发者创造价值,我觉得这样才是有意义的。如果漫天地说速录师被语音识别替代了,或者语音识别去替代翻译了,现在这种论调很多。语音识别这几年来,从讯飞开始,这两年搜狗、腾讯,博鳌的时候腾讯搞得有点砸,这几家都有,阿里也做了云栖大会,每次都做这样的演示。做演示没有问题,在这种特定环境下,作好充分准备的这种“秀”,做了是好事,宣传了技术,作为商业公司,如果我有这样的技术我也会这样宣传,我觉得可以理解。

语音识别是不是能够替代速录师、翻译,包括律师、教师、警察这些职业,准确地来说人工智能的发展能不能替代人的工作,很多人都有担心,尤其是速录师圈子里面还是有一定的恐慌,至少是前期,现在大家都见怪不怪了。首先作为一个技术开发者,我认为语音识别会不会替代速录,准确来说人工智能的方式未来会不会替代速录?应该是个肯定的答案,肯定会替代的。但这个问题不是现在应该担心的问题,它什么时候会替代?目前根本没有一个明确时间表的东西。

刚才我介绍了一位速录师要到底完成哪些工作,语音识别做到了音到字,不管它宣称的多少正确率,这并不是我们速录工作完全完成了的一个事情,我们的用户、客户要得到的结果大部分不是要这样的结果。

另外的一部分怎么去处理?AI现在还没有一种明确的方式,我们现在只是在人工智能这条路上看到了曙光,但还不明确这条路到底有多长。也许它有一天很快,但如果你现在担心,其实你可以一直担心下去,我觉得现在担心没有意义的最大原因是,如果它能做到那一步,其实大部分人类的工作都会被替代了,不仅仅是速录师的问题,不仅仅是翻译的问题,也不仅仅是你是不是可以去当教师、警察。在那个时代,人应该有更多的其他的选项,而不是像现在看到的传统的产业里去考虑,我们还是定义为我们是很传统的职业,是有传承的,速记这个领域也一两千年了。

晓览:像以前的手写速记就已经被电脑速记代替了。

杨议老师:它会被不同的方法去代替,我自己觉得语音识别是蛮好的工具,我最近做的开发也是围绕着这个在做,也希望帮助速录师减轻工作压力,目前还在磨语音识别的结果到速录师之间,不管是校对、同步做参考也好,工作过程怎样更有效、更有意义,现在没有找到一个非常有效的方法,反倒挺耽误时间。可能我们现在的点没有找好,有速录师不断做测试,有速录师在磨合这种工作过程,也许有一天我就找到了一个很好的方法,让速录师的工作难度和体力付出降低了,这都是有价值的。

目前我至少给大家的提示,它是不是会被替代?至少是现在不值得担心的问题,因为担心是毫无意义的。我倒是很希望那一天尽快地来,那个时候人类可以用自己的智慧干一些更有艺术性、娱乐性的事情,哪怕去找一个地方听相声也挺好的。因为技术发展到那一步,不管是农民也好、工人也好、警察也好、军队也好,都不需要人去干,更不要说像速录师,我们以前说的时代的技术分层,人会被技术分在不同的层面上。有些人可能专门去做技术,和人工智能一块不断发展技术,同时有一些人发展人类的美学、艺术领域的东西。有些人像动画片里,像《瓦力》里面演的一样,有的人就是吃吃喝喝、玩玩乐乐也可以,我们现在是没有办法去想象人类那时候的状态,但是我们可以想象在现在的状态下,能够更有效地利用我们已有的技术,能够更好地完成我们的工作,去创造更多的物质财富也好、精神财富也好,我觉得这是我们更需要去考虑的事情。


泽宇速录

初、中、高级速录师培训班,法院书记员集训班零基础入学,一对一教学,毕业后考取国家级证书
电话:0311—80699304 QQ:947267742
地址:石家庄桥西区海悦国际写字楼F座617室

地址:石家庄市桥西区海悦国际写字楼F座617室    电话:0311-80699304 0311-80801119  
版权所有:石家庄泽宇科技有限公司    联系人:黄老师 施老师 刘老师