这样,它就在此过程中保护了用户隐私:数据会自动匿名化和聚合,人类分析师只能看到更高级别的聚类。
以下是这份报告的简要分析:
1、开发用途占第一
虽然在Lmsys的榜单上,OpenAI的GPT模型一直是榜首。但是如果看开发者这个群体,Claude早已经是事实上的口碑No.1了。数据统计也是这样:

Anthropic使用 Clio 分析了与 Claude 在 claude.ai 上的 100 万次对话(包括免费版和专业版),以识别人们最常使用 Claude 执行的任务。结果显示,编码相关任务占据了突出地位:其中"网页和移动应用程序开发"类别占所有对话的 10%以上。软件开发人员使用 Claude 执行从调试代码到解释 Git 操作和概念的各种任务。
教育用途是另一个重要类别,超过 7%的对话集中在教学和学习。还有相当大比例的对话(近 6%)涉及商业战略和运营(包括撰写专业通信和分析商业数据等任务)。Clio还确定了数千个较小的对话集群,展示了Claude用途的丰富多样性。其中一些可能出人意料,包括:
- 梦境解析
- 足球比赛分析;
- 灾难准备;
- 填字游戏的"提示"
- 草莓中的"r"字有几个(好家伙)
2、中文用户最喜欢用Claude写惊悚小说
Claude的使用在各种语言中差异很大,反映了不同的文化背景和需求。Clio计算了每种语言在整体对话中出现的基础频率,从而确定了某些主题中该语言的出现频率明显高于平均水平。
图中展示了西班牙语、中文和日语的一些例子。其中,中文用户最喜欢写惊悚小说,日文用户搞动漫,西语用户研究商业(这么勤奋么……)。

3、Clio的统计流程
*提取特征:对于每个对话,Clio 提取多个"特征"—具体属性或元数据,如对话主题、对话中来回交流的次数或使用的语言。
*语义聚类:相似的对话会根据主题或一般话题自动分组在一起。
*聚类描述:每个聚类都会获得描述性的标题和摘要,这些内容能捕捉原始数据中的共同主题,同时排除隐私信息。
*构建分层结构:集群被组织成多级层次结构,以便更轻松地进行探索。然后它们可以呈现在交互式界面中,供Anthropic的分析人员用来探索不同维度(主题、语言等)的模式。

详情:https://www.anthropic.com/research/clio
更多独家技术见解与热门话题讨论,尽在【开源中国 APP】,与数百万开发者一起,随时随地探索技术无限可能。
暂无更多评论