Nomad AI计划开发适用于更广泛音频识别的应用程序
NomadAI由法国人VivienSeguy于2018年创立,并运行三个应用程序:ChordAI,自动和弦识别词典,Yomiwa(日语)和HanYou(中文)。该公司在爱沙尼亚注册,这得益于其电子居留政策(无论您实际居住在哪里,都可以在爱沙尼亚创建公司并在线进行管理),Vivien可以在工作时旅行。
现在由于流行病,他回到了法国中部的克莱蒙费朗家乡。该办公室位于图灵22的联合办公空间中。
Vivien拥有法国ÉcolePolytechnique的数学和计算机科学学士学位,伦敦帝国学院的应用数学硕士学位以及日本京都大学的机器学习博士学位。 iOS版本的ChordAI,Yomiwa和HanYou属于Vivien的公司NomadAI,后者现在全职运行这三个应用程序。
纪尧姆·贝莱克(Guillaume Bellec)目前是洛桑联邦理工学院(ÉcolePolytechniqueFédéraledeLausanne EPFL)的博士后研究员。 Android版本的ChordAI以他的注册公司Bellec Research的名称命名; Antoine Rolet目前是东京的免费软件工程师,Yomiwa和HanYou的Android版本由其注册公司管理。
在进入博士学位之前Vivien计划已开始制作日语OCR(光学字符识别)应用程序。在攻读博士学位后,他正式开始开发日语词典“读卖”,并将其进一步改编为中文词典“汉有”。
这两个应用分别于2013年和2014年发布。它们是最早具有OCR功能的应用程序之一,甚至早于Google Translate。
AppleStore和Playstore上有许多日文和中文词典应用程序。 Pleco由Pleco代表。
由于多年来与专业词典编辑人员的合作,Pleco的内容更加丰富。 Vivien表示,Yomiwa和HanYou是仅有的具有独特功能(如光学识别,形态文本分析,手写识别和新闻自动词汇获取)的词典应用程序,并计划进一步丰富词典内容。
Yomiwa和HanYou可以免费下载和使用,并且某些特殊功能(例如摄像机OCR或每日自动单词列表)需要通过购买“专业版”来解锁。该模型是一次性付款,而不是会员制。
音频识别是Vivien更加感兴趣的领域。在博士期间,Vivien和AntoineRolet共同开展了一项关于盲源分离的研究项目,该项目的目的是将混合声音从单个录音中分离出来。
同时,Vivien的合作伙伴发表了一篇名为“ SpectralOptimalTransport”的论文,使用了Vivien的研究主题-最佳传输来建立钢琴音符识别算法。后来,Vivien在ICLR2018会议上遇到了另一位博士生Guillaume Bellec。
他还是一名业余音乐家。他们开始讨论如何实现这一想法,ChordAI项目正式开始。
ChordAI使用机器学习算法自动识别音乐中的和弦,键,节拍等,并可以从本地文件,麦克风甚至在同一设备上播放的YouTube中获取音频。 Vivien强调了大量准确标记数据的重要性。
几位创始人首先在公开可用的注释数据集(例如Isophonics,JAAH和Billboard)上训练了算法。数据的数量和质量非常有限,无法达到目标精度。
薇薇安希望获得超越最新研究论文的和弦认可。产生了最先进的技术。
因此,他们很快开始建立自己的数据库,自己注释音频,并以编程方式合成音乐。他们还制作了一个私人iOS应用程序,以简化用和弦和节拍注释歌曲的过程。
因此,Vivien表示,在识别和弦方面,ChordAI比类似公司(例如ChordTracker和Chordify)更准确。 Yamaha的应用程序“ ChordTracker”似乎比Chordify或MyChord更准确,但它只能从本地文件获取音频。
ChordAI现在可以免费下载和使用其大多数功能。某些特殊功能(例如高级和弦识别或音高转换)需要解锁“专业版”功能。
使用它们。费用为10美元/次(截至2021年1月),它不是会员模式。
ChordAI的iOS和Android版本共有大约150,000个活跃用户,每天有1,000次下载(在美国约为50%,在亚洲约为30%,在欧洲约为20%)。每天在这1,000个新用户中,约有5%的用户最终购买了“专业版”。
Vivien表示,ChordAI在法国拥有大约2到300万潜在用户,在全球范围内拥有超过1亿潜在用户。约米