琴艺谱

火山引擎谭待：大模型的超低定价，来自对技术的信心

2024-05-16 11:46:46 no.XX Studio

▓GG俱乐部▓GGPoker[—ggn178.com—]为亚洲最具备实力的一间国际扑克竞技赛事平台,提供一个正规安全有保障的扑克游戏环境,加入立即玩与GGPoker全球玩家一起同乐美将对中国电动汽车加征关税，销量大就是产能过剩？

　　中新网【澜湄印象】2024年1至4月中老铁路累计运输货物655万吨

　　“降价的基本逻辑是@*@#，我们有信心用技术手段降低成本*@*@，市场也需要更低价的大模型%@@%。”

　　5月15日*%，字节跳动豆包大模型在火山引擎原动力大会上正式发布%%#。火山引擎总裁谭待在接受媒体采访时@#，谈到了大模型的定价策略##*#*。

　　豆包大模型的超低价格引发行业震动#@%%。据悉**，豆包主力模型的推理输入价格只有0.0008元/千Tokens%##，比行业便宜99.3%@%。对此@*@#*，谭待坦言@*%%，“降价是用技术优化成本来实现的@*#。如果只是补贴%#，用亏损换收入是不可持续的%@，火山引擎不会走这条路%*%。”

　　据介绍@*%，大模型推理成本的优化#%，技术上有很多手段#%#*。首先是模型本身%*%，模型结构、训练方法都可以持续改进%#，包括业界很关注的MoE(混合专家模型)#%**@，就是优化推理成本很好的解决方案%#*@。

　　其次是工程上的优化@@@%。大模型的调用量越大**@*，优化推理成本的空间也越大*%@@*。以前的模型都是单机推理@%*，大模型用的是分布式推理#*。所以如果能把各种各样的底层算力用得更好**@%*，推理成本就会大大降低@*@。

　　谭待进一步解释说@*##，豆包大模型平均每天处理1200亿Tokens文本、生成3000万张图片*@#@#，这里有不同的负载*%@#，可以把不同任务混合在一起%%#，互相错峰%#*，通过智能调度把它们的利用率都跑得很高@*，就能极大地提升资源利用率#*，实现整体成本的优化#*#%*。

　　另外以字节内部业务为例**#*，飞书的主要流量高峰在工作时间@*#@%，抖音在下班后休闲时间的流量更高%*，这些不同业务的大模型推理*@%%，也能根据业务特点错峰使用#*@##，就可以降低成本*%#。

　　对于“大模型开始价格战”的说法%@#@，谭待认为**#@*，大模型市场仍在发展初期##@@#，远远没到激烈竞争的阶段%@。“池塘有多大*@**，鱼就有多大@*%，现在整个池塘还在培养的过程%@*@%。”

　　“一个人现在创业*%%#，如果要花1万块钱调用大模型%#，可能会觉得有点贵#%。我们把价格降到1%都不到*%%#，100块钱就能用起来#%，他的想法也就更容易尝试@%*#。”谭待表示##**，企业的AI转型充满不确定性%@*#%，试错成本要尽量低*%%%，才能更快更多地实现大模型的应用落地*%*@，从而让整个行业受益#*。

【编辑:唐炜妮】

琴艺谱

琴艺谱

火山引擎谭待：大模型的超低定价，来自对技术的信心

2024-05-16 11:46:46 no.XX Studio

相关推荐

北京冬奥会开幕倒计时200天

20240516

又见“别人家”的学校：夏日炎炎这所学校学生上课喝啤酒惹人羡

20240516

韩国首尔举行“汉江发呆大赛”

20240516

列车“天上”飞武汉光谷空轨成热门打卡地

20240516

企业家个人信息遭大规模泄露？涉事平台已异常、三大运营商回应

20240516

河北兴隆：百年流苏绽放满树繁花飘香

20240516

英摄影师捕捉三只鹿张望瞬间角度完美一致好似重影

20240516

“动物园20只东北虎死亡”安徽阜阳林业部门通报回应

20240516

河北兴隆：百年流苏绽放满树繁花飘香

20240516

新疆喀什市万亩“海水稻”插秧工作全面展开

20240516

最新更新

欧洲南方天文台拍摄炫目星空如烟火盛放

20240516

【凡人歌】这个冬天，冰球很“热”

20240516

攀上悬崖峭壁铁路“蜘蛛侠”守护列车运行安全

20240516

违法和不良信息举报受理和处置管理办法

20240516

塞学者：依托“一带一路”倡议塞中深化合作造福民众丨世界观

20240516

朝中社：金正恩视察朝鲜重要武器装备生产情况（图）

20240516

联合试训投射出色，“小詹姆斯”能被选秀进NBA吗？

20240516

粤港澳大湾区四条城际铁路将贯通运营

20240516

东西问·中外对话｜为何说朔尔茨访华，是“明智的选择”？

20240516

美将对中国电动汽车加征关税，销量大就是产能过剩？

20240516

海南职教学子“炫”技：传统文化“潮”起来新兴专业“火”起来

20240516

浙江杭州：麦浪涌动丰收在望

20240516

法国发生囚车遭袭事件至少两名狱警殉职

20240516

互联网宗教信息服务许可证

20240516

新款iPadPro存在渲染失常问题？苹果中国客服回应

20240516