当前位置:首页 > 源码资源 > 正文内容

第一个通过强化学习人类反馈 (RHLF) 进行训练的大型开源聊天机器人

二向箔2023-04-29 16:14:58源码资源1120

photo_2023-04-29_10-51-39.jpg


第一个通过强化学习人类反馈 (RHLF) 进行训练的大型开源聊天机器人


模型下载:

https://huggingface.co/CarperAI/stable-vicuna-13b-delta


Stability AI 发布了 StableVicuna,这是 AI 世界上第一个开源 RLHF LLM 聊天机器人

https://stability.ai/blog/stablevicuna-open-source-rlhf-chatbot


扫描二维码推送至手机访问。

版权声明:本站内容为原创和部分整理自网络,如有侵权务必联系我们删除,保障您的权益,本站所有软件资料仅供学习研究使用,不可进行商业用途和违法活动,本站不承担任何法律责任。

本文链接:https://www.erxbo.com/post/770.html

分享给朋友:

“第一个通过强化学习人类反馈 (RHLF) 进行训练的大型开源聊天机器人” 的相关文章

Lamini 让开发人员轻松创建类似于ChatGPT的语言模型

Lamini 让开发人员轻松创建类似于ChatGPT的语言模型

Lamini 让开发人员在大规模数据集上训练高性能语言模型,无需成为机器学习专家,通过Lamini,可以轻松创建类似于ChatGPT的语言模型官方网址:https://lamini.ai/blog/introducing-lamini...

一款平替AutoGPT的工具:AI Agent

一款平替AutoGPT的工具:AI Agent

一款平替AutoGPT的工具:AI Agent | #工具众所周知,AutoGPT是最受欢迎的开源AI代理之一,它非常强大,用于自动化整个工作流程,自主地去实现给定的目标,但使用起来有很高的门槛。而AI Agent则完全不用,不要技术能力和API密钥,墙内能用。输入你要实现的目标,它自动会帮你去实现...

潘多拉 Pandora一个开源的 ChatGPT 命令行工具

潘多拉 Pandora一个开源的 ChatGPT 命令行工具

潘多拉 Pandora,一个开源的 ChatGPT 命令行工具,可直接通过 access token 来访问网站功能。后端优化,绕过 Cloudflare,提升访问速度。主要用于解决以下问题:- 高峰期能绕过官方限制,继续使用;- 应答速度直逼 PLUS;- 官方故障的时候,它可能还是能跑;- 多模...

复旦大学发布大语言模型 MOSS 引发轰动

复旦大学发布大语言模型 MOSS 引发轰动

复旦大学发布了一个引发轰动的大语言模型:MOSS这是一个支持中英双语和多种插件的开源对话语言模型,moss-moon系列模型具有160亿参数,在FP16精度下可在单张A100/A800或两张3090显卡运行,在INT4/8精度下可在单张3090显卡运行。MOSS基座语言模型在约七千亿中英文以及代码单...

英国成立AI特别工作组:初始资金1.25亿美元 开发基础模型

英国成立AI特别工作组:初始资金1.25亿美元 开发基础模型

英国成立AI特别工作组:初始资金1.25亿美元 开发基础模型英国宣布成立特别工作组,并提供1亿英镑(1.245亿美元)初始资金用于开发医疗和教育等领域使用的基础模型,包括ChatGPT这种大语言模型。英国首相苏纳克表示:“利用人工智能的潜力为发展经济、创造高薪工作以及加强医疗和安全提供了巨大的机会。...

发表评论

访客

◎欢迎参与讨论,请在这里发表您的看法和观点。