计算机行业点评:Anthropic推出Claude 3,能力对标GPT-4 平安证券 2024-03-06(3页) 附下载
发布机构:平安证券发布时间:2024-03-06大小:513.4 KB页数:共3页上传日期:2024-03-07语言:中文简体

计算机行业点评:Anthropic推出Claude3,能力对标GPT-4平安证券2024-03-06.pdf

摘要:事项:当地时间3月4日,Anthropic推出Claude3系列大模型,包括Claude3Haiku、Claude 3 Sonnet和Claude3Opus三个版本。平安观点:Anthropic推出Claude3系列大模型,能力对标GPT-4。当地时间3月4日,Anthropic推出Claude3系列大模型,包括Claude3Haiku、Claude3Sonnet和Claude3Opus三个版本(按能力升序排列),用户可以根据具体应用情况平衡智能水平、响应速度与成本,选择合适的版本。Opus作为Claude3系列智能程度最高的模型,其在多项人工智能系统常用评估基准方面均优于OpenAI的GPT-4。具体而言:根据Anthropic官网数据,在本科生级别知识(MMLU)、研究生级别推理(GPQA)、基础数学(GSM8K)、数学问题求解(MATH)、多语言数学(MGSM)、代码能力(HumanEval)、文本推理(DROP,F1score)、综合评价(BBH))、知识问答(ARC-challenge)、常识(HellaSwag)等方面,Claude3OpusvsGPT-4的评估结果分别为86.8%vs86.4%、50.4%vs35.7%、95.0%vs92.0%、60.1%vs52.9%、90.7%vs74.5%、84.9%vs67.0%、83.1vs80.9、86.8%vs83.1%、96.4%vs96.3%、95.4%vs95.3%。此外,Opus在复杂任务方面表现出接近人类水平的理解力和流畅性。Claude3在响应速度、视觉能力、上下文理解能力、输出准确度、长文本能力等方面表现出色。1)响应速度:Haiku目前是市场上响应速度最快、性价比最高的模型,它可以在三秒内阅读完一篇arXiv上的包含图表且信息和数据量巨大的论文(约10000token)。Anthropic预计,Haiku推出后,其性能将进一步提升。2)视觉能力:Claude3作为多模态大模型,具有强大的视觉能力,Claude3可以处理包括照片、图表、图形和技术图表在内的多种视觉格式,在其部分客户知识库中,有50%的信息是以PDF、流程图及幻灯片等格式存储的。3)上下文理解能力:Claude3在上下文理解方面取得明显改善,相比前几代模型,Claude3对请求的理解更加精准,在面对可能触及系统边界的询问时,拒绝回答的可能性明显降低。4)输出准确度:与Claude2.1相比,Opus在回答具有挑战性的开放式问题时的准确性实现了翻倍。此外,公司将在Claude3中启用引文功能,使其可以直接引用参考资料中的原文来支撑其输出的答案。5)长文本能力:Claude3将在发布时提供200K上下文窗口。Claude3三个版本均可接受100万tokens的输入,该能力将面向有需求的客户定向开放。Claude3定价体系公布,Sonnet和Haiku版本相比GPT-4具有价格优势。Claude3的三款产品基于其性能,对标不同类型的市场进行了差异化定价。Opus是Claude3系列中智能水平最高的版本,每100万tokens输入/输出收费分别为15美元/57美元,主要应用于跨API和数据库规划及执行复杂操作、药物发现、以及市场趋势的分析预测等场景;Sonnet在智能程度和响应速度之间进行了平衡,每100万tokens输入/输出收费分别为3美元/15美元,主要用于RAG,产品推荐、定向营销,以及代码生成、质量控制、从图像中解析文本等场景;Haiku是Claude3系列中响应速度最快的版本,每100万tokens输入/输出收费分别为0.25美元/1.25美元,主要应用于实时互动及翻译、在内容审核时捕捉危险行为或客户请求、以及优化物流、库存管理等场景。对比GPT-4 Turbo每百万tokens输入/输出费用10美元/30美元,虽然Opus的价格高于GPT-4 Turbo,但是Sonnet及Haiku相比GPT-4具有价格优势。Opus和Sonnet目前已可以在claude.ai和ClaudeAPI中使用,ClaudeAPI已在159个国家和地区普遍可用;Haiku即将推出。随着Claude3全系列商业化步伐的推进,其有望凭借出色的模型能力以及差异化的定价体系在大模型领域的激烈角逐中赢得一席之地。投资建议:近期,海外大模型持续迭代。OpenAI的文生视频大模型Sora、谷歌的Gmini1.5及基础世界模型Genie、Anthropic的Claude3等均在近期陆续发布。同时,科大讯飞、百度等国产大模型领军企业也在对标国际主流大模型持续追赶。当前,全球范围内大模型领域的竞争依然白热化,这将持续拔升大模型的整体能力水平,提升大模型的多模态能力。大模型需要大算力,大模型算法的迭代升级将为全球和中国AI算力市场的增长提供强劲动力。在美国对华半导体出口管制升级的背景下,我国国产AI芯片产业链将加快成熟,相关AI芯片和服务器厂商将深度受益。另外,在应用端,我国国产大模型能力持续升级,AIGC产业未来发展前景广阔。在标的方面:1)算力方面,推荐浪潮信息、中科曙光、紫光股份、神州数码、海光信息、龙芯中科,建议关注工业富联、寒武纪、景嘉微、高新发展、拓维信息、软通动力;2)算法方面,推荐科大讯飞;3)应用场景方面,强烈推荐中科创达、恒生电子、盛视科技,推荐金山办公,建议关注万兴科技、同花顺、彩讯股份;4)网络安全方面,强烈推荐启明星辰。风险提示:1)国内大模型算法发展可能不及预期。2)AI算力供应链风险上升。3)大模型产品的应用落地低于预期。

免责声明:
1.本站部分作品是由网友自主投稿和发布、编辑整理上传,对此类作品本站仅提供交流平台,不为其版权负责。
2.如发布机构认为违背了您的权益,请与我们联系,我们将对相关资料予以删除。
3.资源付费,仅为我们搜集整理和运营维护费用,感谢您的支持!

合集服务:
单个细分行业的合集获取请联系行研君:hanyanjun830

关于上传者

文档

159

粉丝

0

关注

0
相关内容
加入星球
开通VIP,可免费下载 立即开通
开通VIP
联系客服 扫一扫

扫一扫
联系在线客服

公众号

扫一扫
关注我们的公众号

在线反馈
返回顶部