in

Google巴德统计数据和事实[2024年7月]

根据2024年7月的最新统计数据,了解有关Google Bard的所有最新统计数据。

Google Bard的推出使其成为聊天机器人行业中与ChatGPT的主要竞争对手。Google Bard是一个对自然语言理解并以更自然的方式与人类互动的对话式AI聊天机器人。

由Google的研究和开发团队开发的对话应用语言模型(LaMDA)提供支持,该平台提供了自动主题建议、个性化对话和丰富的上下文理解等独特功能。

聊天机器人是一种人工智能,可以根据用户的查询创作图像、音乐、诗歌、内容和其他创意作品。Bard是深度学习聊天机器人的一个例子——这涉及使用从用户那里获得的有机数据进行AI处理,以改进其答案。

本博客文章将深入探讨Google Bard的统计数据,包括发布时间表、用户人口统计信息和技术细节。

以下是惊人的Google Bard统计数据(用户、事实)

  • Google Bard由LaMDA AI语言模型提供支持,于2024年2月6日正式发布后于2024年3月21日向用户公开发布。
  • 截至2024年3月,Google Bard已经获得了3000万个月访问量,主要来自美国和英国用户。
  • LaMDA是在包含1.56万亿词和1370亿参数的Infiniset数据集上训练的。然而,LaMDA论文中确实指出,该数据集包含各种来源,包括书籍、文章、网站和代码仓库。这种多样性的来源帮助LaMDA了解各种主题,并生成既有信息性又引人入胜的文本。
  • Google Bard在全球范围内扩展到180多个国家,并预计可以吸引10亿消费者。
  • 将Google Bard整合到Google搜索中的成本很难估计,因为它将取决于多个因素,包括整合的规模和复杂性、计算资源的成本和人力成本。据估计,如果ChatGPT类似的Bard只回答一半的搜索,并用50个单词的回答,到2024年,Google的成本将上升60亿美元。
  • Alphabet董事长约翰·亨尼西表示,与普通搜索相比,AI聊天机器人的成本要高出10倍。

根据初步数据,Google的Bard聊天机器人在5月吸引了1.426亿访问者,而4月时为4970万(增长187.2%)。

Google Bard统计数据简介(截至2024年7月)

事实 数据
发布时间表 2024年2月6日(正式发布),2024年3月21日(获得访问权限)
语言支持 美国英语
Google Bard的基础 LaMDA(对话应用语言模型)
成本 每个查询额外花费约0.003至0.028美元,加上每个查询约0.003美元的基本搜索成本

Google Bard发布时间表

官方发布日期:2024年2月6日,由Google发布。[1]。

获得访问权限:于2024年3月21日向用户提供对Google Bard的公开访问。[2]。

语言支持:Google Bard仅支持一种语言,美国英语、日语、韩语[3]。

Google Bard基于LaMDA

LaMDA代表对话应用语言模型。它是一个基于大规模文本和代码数据集训练的大型语言模型。[2]。

相关阅读- [Can Turnitin detect Google Bard?]

每次查询的预计成本

瑞银集团的专家在2024年3月计算出,对于每个搜索查询,Google打开其AI聊天机器人Bard,将额外增加约0.003至0.028美元的费用,这将叠加在每个查询约0.003美元的常规搜索成本上。这将导致每次Bard搜索的总成本在0.006至0.031美元之间。

巴德搜索的实际成本将取决于多个因素,包括查询的复杂性、巴德模型的大小以及生成响应所需的计算能力。然而,每次查询的估计成本表明,使用巴德进行搜索可能会显著增加谷歌的成本。

谷歌巴德用户统计

事实 数据
月度访问量 3000万活跃用户(2024年3月)
用户人口统计 美国(62.6%)、英国(8.29%)、中国(3.22%)
性别 谷歌巴德用户主要为男性(60%),年龄在25至34岁之间(35%)。
区域访问 美国和英国
平均访问时长 3.19分钟
使用情况 研究:40%的用户使用谷歌巴德进行感兴趣主题的研究。创作:30%的用户使用谷歌巴德创作诗歌、故事和剧本等内容。生产力:20%的用户使用谷歌巴德在工作或学习中帮助他们。娱乐:10%的用户使用谷歌巴德玩游戏、观看视频和听音乐。

谷歌巴德技术统计

事实 详细信息
LaMDA的训练数据集 Infiniset
Infiniset数据集构成 1560亿个词、1370亿个参数
预训练文本数据大小 750 GB
信息更新和来源 不断从互联网收集信息

Infiniset数据集构成

Infiniset数据集是用于训练谷歌巴德的大规模文本和代码数据集。该数据集包括以下来源:

  • 12.5%基于C4的数据:这些数据来自C4数据集,该数据集是来自公共论坛的对话集合。
  • 12.5%英文维基百科:这些数据来自英文维基百科。
  • 12.5%来自编程问答网站、教程等的代码文档:这些数据来自各种来源,包括编程问答网站、教程和其他在线资源。
  • 6.25%英文网页文档:这些数据来自各种英文网站。
  • 6.25%非英文网页文档:这些数据来自各种非英文网站。

Infiniset数据集是一个非常庞大且多样化的数据集,有助于谷歌巴德具有更多知识和多功能性。该数据集涵盖了各种主题,从技术主题到日常对话。

这使得谷歌巴德能够回答各种问题并生成各种创意文本格式。

LaMDA的训练数据集:Infiniset

LaMDA模型是在Infiniset数据集上进行训练的,该数据集包含了1.56万亿个词和1370亿个参数。这个庞大的数据集需要750 GB的存储空间来存储其内容,使其成为模型学习和在应用中变得更加知识渊博和灵活的理想平台[5]。

谷歌巴德的未来

  • 预计到2025年,巴德将拥有10亿用户。
  • 巴德被企业和组织用于多种目的,包括客户服务、市场营销和研究。

Written by 小竞 (编辑)

他们称呼我为小竞, 做作为河小马的助理有5年时间了,作为jingzhengli.com的编辑,我关注每天的科技新闻,帮你归纳一些现有科技以及AI产品来提升你的生产力,拥抱AI,让科技和AI为我们服务!