政府专注于开发基于本土的语音AI模型,而不仅仅是文本驱动的模型,该模型目前主导了全球AI部门。这一举动有望提高可访问性,从而使人口的大部分能够通过语音而不是文本与AI与AI互动。
与传统的AI聊天机器人(例如Openai的Chatgpt,Google的双子座)或Elon Musk的Grok(主要是基于文本的Grok)不同,政府的方法是关于人声互动。尽管全球科技公司在其AI助手中引入了语音功能,但他们的模型主要针对英语和少数其他语言进行了优化。
这次推动背后的基本原理是明确的:绝大多数人口比打字更愿意说他们的母语。 “互联网将变得更加支持语音,并且会有许多人希望使用语音命令访问服务,”电子和IT部(Meity)的其他秘书Abhishek Singh在交互中告诉FE。
辛格(Singh)领导着10372亿卢比的印度特派团(Indiaai Mission),他强调了基于土著语音的AI模型的市场潜力。 “如果有人在印度开发了基于语音的大语模型(LLM),那将是改变游戏规则的人。声音将成为一个重要的推动者。”他说。
印度拥有约9亿活跃的互联网用户,但约有5亿人离线。其中许多人,包括农村社区,农民和非科技的人,可能会发现通过语音而不是书面文本与AI互动更容易。
例如,寻求有关作物疾病或天气更新信息的农民可以简单地在其本地方言中询问AI助手,而不是导航基于文本的界面。同样,寻求健康建议,政府计划或教育内容的个人可以从AI驱动的语音互动中受益匪浅。
鉴于全球AI公司无法完全迎合该国的语言多样性,对印度特定语音AI模型的需求很大。尽管一些国际AI系统支持多种语言,但他们对印度语言的培训数据集仍然有限。辛格说,任何在印度数据集中培训的AI模型,专门为该国的语言和文化细微差别而设计,将超过该领域中现有的全球模型。
为了加速土著AI模型的发展,政府已收到了有兴趣建立基础AI模型的初创企业,学术机构和私营企业的67个建议。技术委员会目前正在评估这些建议,选定的项目将获得政府资金。
辛格说:“我们已经收到了大约22个关于大语模型的建议,在医疗保健,教育和农业等领域,针对较小的领域特异性模型的提案。”选择标准将包括所涉及的团队的技术证书,模型的预期目的以及其部署的预期影响。
此外,国家数据集平台正在为AI开发人员提供用于培训目的的匿名,非个人数据的访问。该计划旨在创建一个结构化的生态系统,在该系统中,AI初创公司和研究人员可以有效地建立,测试和完善其基于语音的模型。
政府希望通过使用多种印度语言的语音模型进行优先考虑,使AI民主化,使其对更广泛的人群更容易获得和有益。这种方法还将弥合数字鸿沟,并将该国定位为Voice AI创新的领导者。