乐鱼体育平台网页版
李开复零一万物公司回应大模型争议:承认模型结构基于GPT结构
来源:乐鱼体育平台网页版 发布时间:2023-12-26 21:36:50
」的大模型 Yi-34B 引发争议,因研究者发现其基本采用 LLaMA 架构,但只是对两个张量进行了重命名。
2. 有关该模型的性能和成就,包括上下文窗口大小超过200k、一次处理40万汉字、在 Hugging Face 全球开源模型排行榜中获得双料冠军等。
3. 在社区中有人指出,Yi-34B 其实就是对 LLaMA 代码的一次重构,但未作实质性改变,引起对虚假宣传、许可证违规等问题的疑虑。公司回应表示基于 GPT 结构,并在模型训练中遇到的一些需求导致了代码重命名。
站长之家(11月15日 消息:最近,「零一万物」公司旗下的大模型 Yi-34B 因使用 LLaMA 架构但改变张量名引发争议。这一争议中,研究者指出其代码其实就是对 LLaMA 代码的一次重构,只是未作实质性改变。社区担心这可能违反了许可证规定,且未经过框架支持的外部代码附加可能存在安全风险。
Yi-34B 的成就在开源大模型领域引起了广泛关注,其上下文窗口大小超过200k,能处理40万汉字,成为全世界开源模型双料冠军。然而,争议的核心在于其是否真正符合 LLaMA 的许可协议,以及对模型代码的更改是否属于虚假宣传。
在社区的讨论中,有人提到模型的性能参数和配置存在疑虑,包括模型被标榜为32K 模型实际上配置为4K 模型的问题。此外,对于模型的微调数据和基准测试的信息也没有充分提供,引起了社区的疑虑。
「零一万物」公司回应称,他们的模型结构基于 GPT 成熟结构,但在训练实验中由于需求对代码进行了更名。他们强调模型的结构只是其中一部分,投入了大量研发工作在数据工程、训练方法、评估方法等方面,这是他们在大模型预训练阶段的核心技术护城河。最后,他们表示尊重社区的反馈,将代码进行更新以更好地融入 Transformer 生态。
综合来看,争议集中在「零一万物」公司的 Yi-34B 模型是否违反了开源协议,以及其在性能参数和代码修改上的透明度。这一事件提醒开源社区对于模型的合规性和透明度的重要性,同时也反映了在开源领域中公司的技术选择可能引发广泛关注和争议的现实。
11.11云上盛惠!海量产品 · 轻松上云!云服务器首年1.8折起,买1年送3个月!超值优惠,稳定性很高,让您的云端之旅更加畅享。快来腾讯云选购吧!
11月24日,零一万物基正式对外发布并开源微调模型Yi-34B-Chat,可申请免费商用。零一万物还为开发者提供了4bit/8bit量化版模型,Yi-34B-Chat4bit量化版模型可以直接在消费级显卡上使用。Yi系列模型已在ModelScope社区开源,开发的人能在社区中下载、推理和训练这些模型。
仅次于GPT-4,李开复零一万物Yi-34B-Chat最新成绩公布——在Alpaca经认证的模型类别中,以94.08%的胜率,超越LLaMA2Chat70B、Claude2、ChatGPT!不仅如此,在加州大学伯克利分校主导的LMSYSORG排行榜中,Yi-34B-Chat也以1102的Elo评分,晋升最新开源SOTA开源模型之列,性能表现追平GPT-3.5。在五花八门的大模型评测中,伯克利LMSYSORG排行榜采用了一个最为接近用户体感的“聊天机器人竞技场”特殊测评模式,让众多大语言模型在评测平台随机进行一对一battle,通过众筹真实用户来进行线上实时盲测和匿名投票,11月份经25000的线个大模型的总得分。”现在,Eric慢慢的变成了Yi-34B的忠实拥趸,会使用Yi-34b-200k数据集训练其他的模型产品,并感叹丝滑般的训练体验。
华中科技大学官方发文称,该校软件学院一团队发布了多模态大模型Monkey”。该模型擅长图像描述和视觉问答,可以在一定程度上完成对世界的观察”,对图片进行深入问答交流和精确描述。值得一提的是,该团队已将Monkey代码在全球最大的代码托管服务平台GitHub上开源。
今天在朋友圈看到一张图:国内的“百模大战”已升级成“两百模大战”,据不完全统计,今年1-7月国内共发布了64个大模型,截至目前叫得出名字的国产大模型已接近200家。这么多大模型,哪些是真能打的?在每天冒出来的各类“榜单”上出现了“家家第一”的情况,甚至已不止一款国产大模型“碾压”了GPT-4,且很多“世界顶级”大模型是出自刚成立的团队之手。有没有B端客
李开复的Yi-34B-Chat模型在多个评测中大放异彩。其94.08%的胜率超越了LLaMA2和ChatGPT等主流大模型,尤其在加州大学伯克利分校主导的LMSYSORG排行榜中,以1102的Elo评分追平了GPT-3.5。这一系列的成绩和问题共同勾勒出Yi-34B-Chat模型的成功轨迹,尽管受到一些质疑,但其在技术创新和用户体验方面的表现仍然备受瞩目。
汉字序顺并不定一影阅响读。日本东京大学的一项实验发现,这个“定理”居然也适合GPT-4。他还把这段内容放进了OpenA官方的tokenizer工具,发现GPT-4看到的token其实是这样的:这里面除了“UNDER”、“SEA”和“OF”之外,几乎剩下的所有token都看起来“毫无逻辑”,这更加使人费解了。
在理想汽车智能软件发布会上,理想带来了MindGPT,这是理想全自研的多模态认知大模型,目前还处于内测版本。MindGPT是行业唯一不需要任何指令词就能够正常的使用的大模型,也是行业唯一真正围绕车载场景打造的大模型。理想汽车全国405家零售中心的展车及试驾车已全部全面升级至OTA5.0内测版,迎接用户到店体验。
给你一首曲子的音频和一件乐器的3D模型,然后问你这件乐器能否演奏出这首曲子。你能够最终靠听觉来辨认这首曲子的音色,看它是钢琴曲还是小提琴曲又或是来自吉他;同时用视觉识别那是件什么乐器。用等价的线性投影模块替换其中一个Q-Former后,图像-3D的性能会下降一半以上,音频-视频的性能会下降超过10个点。
“取消今晚所有计划!”,许多AI开发者决定不睡了。只因首个开源MoE大模型刚刚由MistralAI发布。最新的梗图:磁力链接就是新的arXiv。
在12月22日的全国信息技术标准化技术委员会人工智能分委会全员会议上,腾讯混元大模型率先通过国家大模型标准符合性测试。本次评测由中国电子技术标准化研究院发起,基于32个细分维度,对国内主要的大模型来测试。腾讯云还以提案牵头方身份启动《人工智能模型即服务功能要求》的讨论与编制,推动MaaS领域标准化。
EmojiBrew是一个提供数千种表情符号组合供用户复制和粘贴的网站,用户都能够搜索各种表情符号组合,并提交自己发现的表情符号组合到数据库中。
ChatGPT Finder 是一个用于管理和共享 ChatGPT 创建文件的强大工具。它具有美观和便捷的界面。您能够正常的使用 ChatGPT Finder 在一个地方管理所有创建文件,通过对话查找创建文件或一次性下载所有创建文件。您还能够正常的使用 ChatGPT Finder 在 ChatGPT 中使用浏览器扩展程序。
KraspAI Kompass是一个用于比较顶尖语言模型的平台,用户都能够在不到一分钟的时间内测试各种提示,包括闭源和开源模型。用户都能够创建自己独特的测试套件,并无需编码即可比较模型。该产品分为免费版、专业版和企业定制版,用户都能够根据自己的需求选择合适的版本。
GenAlt生成在线图像的描述性替代文本,为那些需要的人提供帮助。只需右键单击图像,然后单击“从GenAlt获取替代文本”,即可获得图像的描述作为其替代文本。要查看生成的标题并将其复制到剪贴板上,只需选择“从GenAlt复制AI图像描述”。用户的一些GenAlt见证如下: 1. “GenAlt对我理解照片很有帮助......比现有工具好。”——无障碍倡导者和Twitch主播 2. “GenAlt真的比互联网上的其他应用程序更有帮助,帮助我更好地描述图片。”——高中二年级学生Remi 3. “GenAlt易于使用,有助于让社交媒体对我更具可访问性。”——大学新生Aaron
Bigsib 是一款智能 AI 助手,可以自动处理客人问题,并以亲切而对话的方式回答,大大减少客服工作量,提供全天候支持。如果 Bigsib 无法解决问题,会自动转交给您的支持团队,确保客人始终获得最佳体验。您可以设置 Bigsib 在向客人发送自动生成的回复之前征求您的批准。同时,您还可以自定义支持内容,让 Bigsib 根据您的需求提供准确的答案。Bigsib 还能够准确的通过您的房源信息学习,了解设施、入住流程等。您可以根据需要安排 Bigsib 在特定日期 / 时间段内回复客人的查询,也可以在客人未收到您的回复一定时间后由 Bigsib 介入。Bigsib 受到高端度假租赁的信赖。
这个应用程序类似于 GIF 键盘,但是你可以直接在 iMessage 中生成自己的 AI 图片。与家人、朋友和全世界的人分享你的创作,并登录查看有多少人在分享你的图片。完全免费,无需订阅或应用内购买。
Entrov通过简化合作伙伴的获取过程,缩短平均销售周期时间,以及增加交易规模,消除了对于哪些合作伙伴将帮助您完成交易的猜测。它可以节省每笔交易高达2个小时的时间。通过机器学习,它帮助您找到最佳的合作伙伴,避免浪费时间和拖延交易。Entrov采用技术为先的销售和合作伙伴协作方式,利用机器学习技术,我们的专有搜索引擎帮助您找到传统方法无法做到的顶级合作伙伴的主要能力、支持的行业和B2B关系。定制的合作伙伴资料突出显示特定的市场推广资产和成功案例,量身定制您所期望的使用情况。我们清晰的用户界面将所有合作伙伴资产、使用案例和联系人整合到一个窗口中,简化您的搜索流程。不再需要翻阅琐事,更轻松地完成交易。
ChatShitGPT是一款非同寻常的聊天机器人,能够为用户提供娱乐和消遣。其特色在于具有个性化的角色,用户可以选择与海盗、主角或者愤怒的角色进行互动。用户可以免费开始使用,但也提供订阅服务。产品定位为提供娱乐、消遣和放松的聊天体验。
Qlient AI 是为寻求高效客户管理的企业设计的创新解决方案。我们的 24/7 AI 语音助手自动化客户接待、简化沟通,并增强客户参与度。
LLaMa2lang 是一个便利脚本,用于将 LLaMa2-7b 优化为特定语言的聊天模型。它使用 Huggingface 的 Open Assistant 数据集作为基础数据,并使用 OPUS 翻译模型将其完全翻译成目标语言。然后,使用 LLaMa2 的提示格式将翻译的数据集转换为聊天模型的输入格式。最后,使用 QLoRA 和 PEFT 对 LLaMa2-chat 进行微调。通过使用 LLaMa2lang,您可以为任何非英语语言创建适用于聊天的 LLaMa2 模型。
Remko.online是一款基于OpenAI GPT-4的智能应用,旨在提供多种功能。它可以帮助用户起草文件、进行尽职调查、提供快速帮助,并提供有趣的知识测验。该应用还提供WhatsApp接口,用户可以通过WhatsApp号码参与知识测验,并随时了解自己的得分情况。Remko.online还提供样本内容供用户参考,以及灵活的定价方案。作为一款智能应用,Remko.online的定位是为用户提供便捷、多功能的智能辅助服务。
Free Job Description Generator是一款AI职位描述生成工具,能够帮助企业快速创建符合要求的职位描述。用户只需输入职位名称,点击“生成”按钮即可在几秒内获得完美的职位描述。此外,该工具支持多语言生成,可一键发布到250+招聘网站,大大提高了招聘效率。Free Job Description Generator还提供其他工具,如邮件模板生成器、AI面试问题生成器等,助力企业招聘流程的各个环节。
Conftalks 是一个汇总会议演讲的平台,提供各种领域的会议演讲摘要,帮助用户快速了解并获取有价值的内容。该平台涵盖了加密货币、区块链、软件开发、技术、安全、人工智能、自动化、DevOps 等多个领域的会议演讲摘要。用户可以通过你自己的兴趣和需求,浏览并选择感兴趣的演讲内容。
Terrasketcher能够将任何手绘草图转换为更专业的图表和Terraform代码。这个工具能处理简单或复杂的基础设施图表,包括云端和本地环境。用户上传手绘草图后,可以得到一个即刻可用的云图表,适用于文档。此外,Terrasketcher还提供Terraform代码,帮助用户更快部署,并生成可供Drawio工具阅读的draw.io文件。
AI Humanizer是一个免费在线工具,可以将使用 AI 内容生成器生成的文本转化为人类文本,使其百分之百无法被 AI 检测到。它可以转化使用任何 AI 内容生成器生成的文本,确保生成的文本没有抄袭。
Opinly.ai是一款竞争对手分析工具,能够自动化和简化对竞争对手的分析过程。无需具备数据科学技能,用户可以跟踪实时定价变化、分析功能发展,并获取深入的商业洞察。
KREA 是一款设计工具,拥有实时生成、AI 图像提升、AI 应用等功能。它能够帮助用户快速生成和增强图像,并提供多个简洁易用的 AI 应用。
CodeFormer是一个基于 Transformer 的预测网络,用于图片马赛克恢复。通过学习离散码本和解码器,它能够减少恢复映射的不确定性,生成高质量人脸。它具有优秀的抗退化鲁棒性,适用于合成数据集和真实数据集。
Hypeman是一款专为渴望成为音乐家和经验丰富的词曲作者而设计的终极创作工具!它拥有易于使用的界面和先进的功能,能够帮助您撰写能够抓住观众并激发他们对音乐的灵感的歌词。不论您是独立艺人还是乐队成员,Hypeman都能满足您将词曲创作提升至新水平的需求。它拥有强大的基于人工智能的创作助手,可以帮助您生成新的创意,并提出替代措辞以改进您的歌词。此外,借助直观的界面和易于使用的工具,您可以快速记录想法并在移动中编辑歌词。Hypeman还拥有先进的协作功能,让您可以轻松与乐队成员、制作人或其他任何您想合作的人分享作品。您还可以将歌词导出为各种格式。如果您准备将词曲创作提升至新水平,请立即下载Hypeman,并开始创作下一首热门歌曲吧!
ChatNBX 是一款下一代聊天界面,结合了类似 ChatGPT 的用户界面和在后台运行的开源大模型。它基于强大的语言模型,可以实现智能的对话交互。ChatNBX 能够广泛应用于不同场景,从日常娱乐到商业问题解答,都能提供高效准确的帮助。它还支持多种功能和定制选项,为用户更好的提供个性化的聊天体验。