世界语语音输入已经实现! Voĉa Klavaro por Esperanto jam Funkcias!

作者 aŭtoro | 2022.05.22

去年七月份,我写过一篇关于世界语语音输入的文章,介绍了 Mozilla 基金会开源计划 Mozilla Common Voice (Komuna Voĉo 共同语音)。利用这个技术,通过对机器的训练学习,可以实现世界语语音到文字的转换。

根据当时估算的世界语语音训练参与者数量规模,当时我估计5年后可以实现世界语语音到文字的转化。但前几天在 Amikumu 上看到一位世界语者说 “Voĉa klavaro en esperanto jam funkcias!”(世界语语音键盘已经可以使用!)。我和另一位世界语者留言询问页面链接,都没有得到回答,估计这位世界语者也是偶尔登录 Amikumu,因为这个软件的用户和使用频率,比 Twitter 和 Facebook 要低得多。

搜索国外网站世界语文字的内容,如果用百度,结果基本是零,用微软的必应(bing.com)有时倒是可以找到一些,但今天我用必应也没有搜索到想找的网站,最后还是用谷歌解决了问题。

相关内容是在 reddit 网站找到的。国内无法访问reddit 网站,所以我把原文内容附在此文后面,供大家参考。

这个手机应用程序是 Parolteknologio 技术团队开发的。如果你是安卓手机,安装上程序,就可以对着你的手机说话,然后说的内容就会以文字的形式出现在你的手机屏幕上。

世界语语音文字转换软件功能的实现,得益于我们在上一篇文章中介绍的 Mozilla Common Voice 开源计划。1000多名世界语者参与了机器语音识别训练工作(这其中有你吗?)。程序还处于继续开发完善阶段,后期启动和运行速度将会提高,但目前已可用。一位世界语者用语音输入了下面一段话:

Ho ĝi ja funkcias bone punkto fakte mi skribis ĉi tiun mesaĝon per voĉo komo sed ĝi ne estas rapida punkto mi esperas ke la verko daŭrigos kaj pliboniĝos

可以看出,全部识别转换。但当他说 punkto(句号)、komo(逗号)时,程序没有把它们转换成相应的标点符号,而是直接转换成了单词。开发团队人员回复说 “Nu, interpunkcio kaj numeroj estas daŭre problemaj”(标点符号和数字还存在问题)。这个问题应当不难解决。

这个程序的语音输入功能可用于SwiftKey 和 AnySoftKeyboard 键盘。这两种键盘的安装程序,绿网 qq 群均可下载。据说暂不支持 GBoard 键盘。开发团队正在和谷歌接洽,争取让谷歌正式把世界语语音识别功能加入到安卓系统。

目前世界语语音输入已经可用于即时通讯软件 Telegram、WahtsApp,社交网站 Reddit、Amikumu、Facebook、Twitter、Mastodon,在线办公软件 Google Docs、Keep 等和其他数百种程序。

安装、使用方法:

如果你在国外,或者在国内但能不受限制地使用互联网,
1、从 github 网站下载安装程序 https://github.com/parolteknologio/AndroidParolRekono
2、打开谷歌商店安装 https://play.google.com/store/apps/details?id=ee.ioc.phon.android.speak
3、安装时,给与这两个程序所需的权限
4、设置 Konele,使用“Vosk parolrekonilo”
5、设置“metodo de eniro”以激活语音键盘。
6、可能需要重新启动手机
7、之后在键盘上点击话筒的图标,稍等就可以开始语音输入了。

这一段时间我无法使用谷歌商店服务,因此无法进行安装测试。等我在 WPS、微信、qq、Foxmail 等国内软件测试使用后,再将测试结果告诉大家。目前大家可以继续参与世界语语音识别训练工作,提高机器的世界语语音识别能力,同时也可以让机器适应你的发音习惯,提高你的语音识别率。

等不及的人,可以让国外的世界语者把相关程序发过来安装使用。

如果想使用这个技术,就需要学习世界语口语了。一位上海世界语者只有14岁,世界语文字水平很不错,她对这个程序很感兴趣。我建议她好好练习一下世界语口语,她说可能一辈子也不做不到用世界语说话。但如果想使用这个程序,就不得不想办法提高世界语口语水平了。根据我使用中文语音识别软件的经验,说得越流利、越连贯,机器识别率越高。随着科技的发展,机器的处理能力也越来越强,我们说话时,不需要像播音员那样字正腔圆,只要不偏离标准发音太多,机器一般都能识别。

附 Reddit 网站原文:

Voĉa klavaro por Esperanto jam funkcias en Android!

La teamo de Parolteknologio preparis por vi voĉan klavaron por Android. Do vi povas paroli al via poŝtelefono kaj ĝi transskribos ĝin al teksto!

Tio estas uzebla en multaj aplikaĵoj, inklude tujmesaĝiloj Telegramo, WhatsApp, sociaj retejoj Reddit, Amikumu, Facebook, Twitter, Mastodon, dokumentaj aplikaĵoj Google Dokumentoj, Keep kaj probable en centoj de aliaj.

Kiel uzi?

elŝutu kaj instalu .apk de https://github.com/parolteknologio/AndroidParolRekono

instalu https://play.google.com/store/apps/details?id=ee.ioc.phon.android.speak

al ambaŭ aplikaĵojn donu bezonatan permeson, kiam ili postulas ĝin

agordu Konele por uzi “Vosk parolrekonilo”

agordu en Android “metodo de eniro” por akcepti voĉan klavaron

eble necesos restartigi poŝtelefonon

poste en la klavaro sufiĉas klaki la ikonon de mikrofono, iomete atendi kaj paroli – jen, espereble ĉio

Funkcias kun klavaroj SwiftKey, AnySoftKeyboard. Onidire ne funkcias en GBoard.

Kvankam ĝi funkcias tre bone, nun ĝi estas baza provo de koncepto kaj la teamo de Parolteknologio laboras por igi ĝian akiron kaj ekfunkciigon pli glata.

La kreo de tiu ĉi voĉa klavaro estis ebla nur danke al grandega laboro de multaj homoj. Pli ol 1 000 homoj voĉlegis por Mozilla Common Voice. Plejparton de tio finance subtenis Kaja per ĉifromono Miriado Al varbado por Mozilla Common Voice helpis ankaŭ Libera Folio, E@I, Vikimedio EO, kaj aliaj. Homoj de AlphaCephei uzis tiujn datumojn por trejni lingvomodelon en Vosk. Jacob Nordfalk integris la esperantan modelon kun Konele, kaj tiel fine kreis la voĉan klavaron. Stefan Grotz dum la tuta tempo kunigadis diversajn homojn kaj estis la animo de la projekto, kaj ankaŭ kreis ĝiaj retejon https://parolteknologio.github.io/ . Mi helpis pri varbado, kunordigado, kaj kunigado de agantoj.

La teamo de Parolteknologio ankaŭ laboras por konvinki Google por oficiale aldoni parolrekonadon por Esperanto al Android. Pli pri tio iom poste

阅读次数 9,692 legintoj

本文评论数 6 komentoj pri “世界语语音输入已经实现! Voĉa Klavaro por Esperanto jam Funkcias!

  1. CADD

    曾经参与过Mozilla的common voice项目贡献开源语音,可惜世界语口语水平不够,只贡献了中文和英语

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注