
“词元”是人工智能大模型为了高效处理数据,把数据进行拆分后的最小信息单元,可以理解为一个字,或是一个词,或是一个符号。在人工智能时代,用户输入的每一个字,大模型生成的每一段话、识别的每一幅图像,都在消耗词元。国家数据局相关负责人介绍,到今年3月,我国日均Token的调用量已经超过了140万亿。
词元消耗量是人工智能产业发展“晴雨表”
国家数据局专家咨询委员会委员张向宏:日均超140万亿的词元调用量,相当于1000万亿个中文词汇,也相当于250个中国国家图书馆的资源量。
国家发展改革委国家信息中心人工智能处工程师 蔡驰宇:词元日均调用量大幅增长,充分表明人工智能正加速从实验室走向千行百业和千家万户,变成了实实在在的生产力工具,像水、电、网络一样,成为智能社会运转的基础资源。词元的消耗量是人工智能产业发展的重要指标和“晴雨表”。
以词元计费为基础的
新型商业逻辑加速演进
作为新生事物的词元,也在催生新的机遇。国家数据局负责人表示,以词元计费为基础的新型商业逻辑正在加速演进。
据了解,围绕词元的调用、分发与结算,一套新的价值体系正在加速演进形成,并成为人工智能产业可能变现的重要路径。
国家发展改革委国家信息中心人工智能处工程师 蔡驰宇:过去,一家企业使用信息服务,就得购买信息软件,那是一次性购买软件的价格;现在一家企业同样是使用信息服务,它可能直接调用的是大模型的接口,用多少词元,就付多少费用,以词元消耗量的多少作为计费的依据。
与此同时,专家表示,词元消耗量增长也对电力资源提出了更高需求。今年的政府工作报告中提出,实施算电协同等新基建工程。
国家数据局专家咨询委员会委员 张向宏:算电协同的本质含义,就是要使用我们国家具有超前优势的绿电来发展我们的算力产业和人工智能产业。
我国正加快推动数据领域
新名词新术语解释工作
像Token这类人工智能领域专业名词如何翻译,引发了广泛热议。记者昨天(24日)从全国数据标准化技术委员会了解到,全国数标委正加快推动一系列数据领域新名词新术语的解释及国家标准研制工作,更好赋能人工智能产业高质量发展。
郑重声明:此文内容为本网站转载企业宣传资讯,目的在于传播更多信息,与本站立场无关。仅供读者参考,并请自行核实相关内容。
展览现场。中国国家博物馆供图123456789下一页人民网北京1月9日电(记者刘微)1月8日,由中国...
1月8日,人们在西乌珠穆沁旗的一家瑜伽馆练习瑜伽。近年来,在内蒙古锡林郭勒盟西乌珠穆沁旗,随着牧区生...
春节临近,沈阳局集团公司沈阳车务段把电煤运输作为重中之重工作来抓,确保管内11家电厂电煤储备充足,为...
据人民银行官网消息,人民银行今日发行中国空间站建成金银纪念币一套。该套金银纪念币共2枚,其中金质纪念...