Select Language

AI社区

数据要素产业

凌空手写、方言识别?百度搞的是噱头还是创新?

最近,小黑的一个小伙伴被他在百度输入法里新发现功能的震惊了,于是兴冲冲跑来,要告诉小黑这个他看来很厉害的创举:

百度输入法现在有凌空手写功能,还可以支持识别部分方言了哟!

对此,小黑本人的反应是:第三方输入法啊……好久没用了呢。

不过,既然小伙伴都这么兴致勃勃了,小黑也不好拂了他的意,恰好小黑也想试试好久没用的第三方输入法们到底长成什么样子了。那么,就让小黑再来当一次APP体验官吧。

其实在输入法领域,用户认可度高的APP也就那么几个。小黑在App Store中搜索关键字“输入法”,显示的前三项刚好是国内用户体量最大的三个输入法APP。

那么,这三款热门的输入法APP相比从前的版本,新增了哪些特别的功能,又好不好用呢?

三款人气输入法 打字效率有什么差别?

在iPhone上开启第三方输入法的权限,大致都是同一个流程。虽然大家应该都知道,但小黑在这里还是简单地测试了一下。

以讯飞输入法为例。当我们首次打开的时候,输入法会出现一个提示页面,提示我们将输入法添加到键盘中,并选取“允许完全访问”。

之后,我们就可以随意使用输入法了。

当然,搜狗输入法还有一项额外提醒,就是导入通讯录。

导入通讯录的好处,是当你需要在使用时输入朋友的名字时会比较方便。但基于目前国内的隐私保护大环境,小黑还是劝你不要导入。

虽然每家公司都告诉用户我们不会收集用户的隐私,但是,谁知道呢。

这三款输入法的键盘布局大同小异,然而,从小黑的角度来说,问题就出在这“小异”上。

以小黑常用的全键盘拼音输入法为例,iPhone原生输入法、搜狗输入法、讯飞输入法和百度输入法的界面依次是这样的。

用惯iPhone原生输入法的小黑在习惯大空格键、地球键切换中英文之后,遇到“中英文切换”键占据空格键的设定就有些不适,时常会发生误触的情况。另外,讯飞输入法和百度输入法都将句号放置在空格旁,百度输入法的空格这一行甚至还有语音识别按键,对小黑来说更增加了误触的概率。

对习惯原生输入法的小黑来说,改变输入法是一件需要重新培养习惯的事情,而对习惯其他输入法的用户来说,也是一样。所以小黑的建议是:没必要去选什么“更好用”的输入法,自己习惯的,就是最好的。

当然,在这三个第三方输入法APP中,让小黑觉得最方便的还是搜狗输入法。特别是上滑输入标点符号的功能,曾几何时让小黑爱不释手。

至于输入法的词库这一块,测试的意义其实并不大,因为现在的输入法都拥有智能学习功能,会自动学习用户使用词汇的频次,从而适应每个用户的使用习惯。

进阶功能汇总 谁的扩展性能更强大?

在进阶功能这一方面,小黑主要会横向对比这三个输入法的一些独有功能。

首先是搜狗输入法。在搜狗输入法的设置菜单中,特别有一项内容是“汪仔助手”。其中包含着表情推荐、资讯推荐、天气推荐等内容。

这些功能通过点击输入法右上角的“汪仔”头像就可以实现。例如,在没有输入任何字时点击汪仔,输入法会自动生成一句“尬聊”的话。

而当用户在微信或者QQ中随便打一个词,再点击汪仔,就提供一些相关表情让用户选择。

不过,这些功能对超正经的小黑来说,都显得比较尴尬,再加上设置中明晃晃的“表情推荐广告”这一项,让小黑忙不迭地关闭了汪仔助手。

此外,在快捷设置面板中,搜狗输入法还有一些诸如钱包、营销盒子之类的功能,让小黑分不清它是一款输入法还是一个营销工具了。

讯飞输入法并没有那么多进阶功能,相对独特的功能主要是语音便签、面对面翻译等相对实用的功能。

小黑测试了一下工具栏中的文字扫描功能,测试的结果有好有坏。

首先,小黑拿起了最近正在测试的一款产品的说明书进行扫描。或许是因为说明书字体太小的关系,扫描结果不尽如人意。

之后,小黑又用它扫描了一本摄影方面的书籍,扫描结果还是不错的,除了一个标点没有被扫描出来,其他文字基本正确。

百度输入法的功能栏中,除了这次引起小伙伴注意的凌空手写之外,没有什么特别的功能。至于方言输入么……搜狗和讯飞老早就实现了更多种方言的语音输入,甚至还都支持多种语言的语音输入和多语言翻译,这早就不算什么亮眼功能了。


凌空手写,实用价值究竟几何?

许多科幻电影中,都有类似的装置,只不过大多数的用途都不是写字,而是进行功能操作。

小黑能想到的最近的例子大概就是人间大炮,哦,不对,上海堡垒了。

而小黑也在网上看到过不少宣传文抓着这一点狂吹百度输入法,比如下面这些。

不过,小黑始终坚信一句话:是骡子是马,还是要牵出来遛遛的。

所以小黑实际使用百度输入法的凌空手写功能,为大家录了几段视频。

首先,小黑测试了几个简单的字:“人”和“入”,百度输入法非常轻松地识别了出来。当然,如果这两个字都识别不出来,那它也就该狗带了。

之后,小黑略微加大了难度,于是百度输入法就懵逼了。小伙伴们也可以猜猜小黑究竟输入的是什么字。

从上面的测试结果来看,凌空手写功能对稍复杂的字几乎没有识别能力。

造成这种状况的原因,小黑觉得主要有两点:首先,凌空手写技术目前还无法判断笔划的转换。例如上面的视频中,百度输入法并不能判断出用户收笔、落笔的时机,手指划过的每一个地方都被连在一起。

此外,物体追踪的算法目前并不完善,即便是捕捉白墙前的手指,但只要手指动的快一点,就无法被即时追踪到了。

不只是小黑的测试说明了这一点,网上许多用户也都觉得:这项技术目前更大的价值还是在娱乐上。

百度的野望不在输入法,而在更广阔的天地

根据小黑收集到的资料,凌空手写技术其实早在2019年1月就已经上线了。

不过,这次新版本的凌空手写技术则是升级后的第二代。

据称,第一代凌空手写技术必须要具有深度/红外摄像头的设备才能追踪、监测指尖的运动轨迹。而升级后的凌空手写技术则只需要有一个过得去的前置摄像头就可以了,这也大大降低了技术的准入门槛,让更多的用户能够体验一番。

不过,如果要让它实用、好用,却并不简单。正如上面的视频所展示的一样,凌空手写功能目前的实用价值并不高,第一个难关就是在识别的准确率方面。

由于降低了对摄像头的要求,凌空手写对算法本身的要求反而大大提高了。物体追踪的算法还只是最基本的部分,更重要的是在文字识别时,对用户的书写习惯的计算,这对任何一家公司来说,都是需要大量投入的事情。

不过,小黑倒并不觉得这只是百度的一个噱头。

就像微博上的用户反馈说的那样,凌空手写功能在目前主要还是为了好玩。无聊的时候玩个类似“我画百度猜”这样的小游戏,似乎还是挺有乐趣的。

但小黑不禁联想到,在Siri这一类语音助手刚出现时,大家呼出它,都只是为了各种“调戏”。但随着技术的不断进步,AI识别准确性的进一步提升,语音助手从原本的“陪聊”助手,也渐渐变成人们在生活中真正的助手,到现在更是成为了智能家居中的重要纽带。

有了这样的先例引导,我们大可放下目前对其“实用性”的讨论,来想象一下凌空手写在未来的实际应用。

事实上,小黑觉得,这项技术最大的用途并不是输入文字。离开单个APP,放眼整个手机生态,它可以实现更多的功能:例如,当我们不方便拿起手机操作的时候,做一个手势就可以点亮屏幕、操作手机,这样想来,是不是有一种科幻片的感觉。

我们甚至还可以离开手机来畅想一下:当我们回到家里,做个手势,客厅的灯光就都打开了,窗帘也随之关闭。回到卧室,再用一个手势,电视上便出现了欢迎界面。换台、调整音量和亮度,这些都可以通过手势来完成。甚至当你想看哪一部电视的时候,也可以通过手势输入剧名完成搜索。

想到这里,小黑不禁开始期待这一天的快点到来。

相比外界对这一功能的吹捧,百度却相当清醒,只是将功能的入口放在快捷设置界面的倒数第二行。甚至在官网和微博上,关于这项功能的介绍也少之又少。

或许,在百度心中,原本就没有将这一功能立即推广的意思。正如小米透明电视等等现在看来“没什么用”的功能一样,这些目前看来花里胡哨的东西真正面向的,是未来。

我们没有必要因为任何一项技术现在的状态就无脑吹捧或者肆意嘲讽。况且,无脑这个词,不正说明了这些吹捧的和嘲讽的人都没什么脑子么?我们真正该做的,是在自己热爱的领域,发挥自己的能力,让这些技术真正变得有实用价值。到那时,我们自然会看到一个更美好的未来。