利用 Meta 的 ImageBind 训练出来的多模态模型。
只使用了 文本-图像 数据进行微调就获得了很好的多模态效果。https://vxtwitter.com/yixuan_su/status/1661064018868551691
OpenCat 这次更新太质变了!
ChatGPT3.5换成claude 1.3,速度起飞效果更好。
再创建一个claude 100k 总结机器人,打开论文全选粘贴,总结要点,随意提问,效果远超 chatPDF。https://twitter.com/waylybaye/status/1659760963179122688
美区苹果id内购限制了怎么办? - 孤独的单机狗的回答 - 知乎
https://www.zhihu.com/question/381956875/answer/2251032474
ChatGPT for iOS
做得很有特色,简简单单的,但是内置了很多细节,属于用了功夫的作品。
- 长按可以复制或进入选择模式
- 支持markdown
- 滑动输入框可以快速新建对话
- 另外最重要的可能是 plus 可以直接用美国区账号购买,叠加支付宝可以充值,所以方便了很多。
缺点:
- 发热量跟游戏差不多
🤕️ https://apps.apple.com/app/id6448311069
OpenAI的CEO Sam Altman参加了一场关于AI监管的听证会,总时长达3个小时。 这里是本次听证会的10个主要重点(word count: 22796, token: 53692 总结: Claude 100k):
1. 人工智能技术正在迅速发展,需要适当的监管。Sam Altman和其他人都呼吁政府采取行动,制定规则和标准来管理AI的风险。
2. 需要明确定义监管的范围和对象。Sam Altman提出可以根据模型的计算能力或功能能力来划定范围。
3. 需要建立独立的监管机构。Sam Altman和Gary Marcus都支持建立一个机构来监管AI技术。
4. 需要制定安全标准和许可证要求。Sam Altman提出需要对超过一定规模的AI模型实施许可证和测试要求。
5. 需要确保不同人群获得公平对待。Padilla参议员提出需要确保AI模型具有语言和文化包容性。
6. 需要保护个人隐私和数据。Sam Altman表示OpenAI允许用户选择不使用其数据进行训练,并可以删除用户数据。
7. 需要防止AI技术被滥用以操纵选举。参议员们担心AI技术可以预测和影响公众舆论和选举结果。
8. 需要保护知识产权。Blackburn参议员担心AI可以生成受版权保护的内容,需要确保内容创作者得到补偿。
9. 需要应对对就业的影响。参议员们担心AI技术会减少工作,需要与行业和政府合作应对这种影响。
10. 需要国际合作。Sam Altman认为虽然美国应该领导,但也需要考虑全球影响,可以探索国际合作的机会。
Poe API 推出,AI 的普及速度要更快了。
现在允许所有开发人员在 Poe 上构建机器人,包括 Anthropic 和 OpenAI 的客户,或其他正在训练自己的语言模型的 AI 公司,或者任何使用开源 LLM 的人。 https://twitter.com/adamdangelo/status/1658121701077516291?s=46&t=9C242iPwhhtbjr6pL2GHuA
今天Midjourney中国开放了测试的申请,很多朋友也加入了,也有很多问题需要解答,所以就想着写一个使用指南帮助大家了解和国际版的不同。详细的文章内容在这里:https://mp.weixin.qq.com/s/4NefHvl7A-o-hVm1PZr5Gw
Читать полностью…Claude 100k 用起来了!
1. 先把 claude 的 API 转成 OpenAI 的格式https://github.com/jtsang4/claude-to-chatgpt
2. 找到支持无限输入的客户端 ChatBox,并填写API
https://github.com/Bin-Huang/chatbox/releases
3.模型选择 GPT4,对应就是 claude 100k
3. 随便找一篇万字长文丢进去,居然算两万多token
4. 总结成功如图
感谢两位开发者
Claude-instant API 也更新到了 v1.1 版本。
增强了代码能力,写作能力,指令遵循能力。
增强了安全性。
这个可以在 poe 里免费使用。
incase 还有人不知道 poe
https://poe.com
Claude 支持 100k上下文,视频 demo :100k上下文能做什么 🤯 https://vxtwitter.com/anthropicai/status/1656700154190389248
Читать полностью…非常有趣的表格
美国人听过 ChatGPT 的不同人群比例
男性、年轻、学历高、Asian 这几个标签很突出
来源
https://pewresearch.org/short-reads/2023/05/24/a-majority-of-americans-have-heard-of-chatgpt-but-few-have-tried-it-themselves/
QLoRA 是一种LLM微调的新技术。
- 12小时的单个消费级GPU上训练,性能就可以达到了ChatGPT的97%
- 4bit训练,但是性能与16bit相当
这个数据有点离谱。。https://twitter.com/Tim_Dettmers/status/1661379354507476994?s=20
微软推出开源的开发者工具Dev Home(下载链接和项目地址见下推),可以连接到GitHub账号,将开发环境部署自动化,并带来为开发人员定制的新存储卷Dev Drive,可以将高I/O负载下的应用构建时间缩短30%。 https://vxtwitter.com/sundyme/status/1661062441743319041?s=20
Читать полностью…在
@Photoshop
(测试版)应用程序中引入生成式填充 - 一种通过简单的文本提示创建非凡图像的全新神奇方式,由#AdobeFirefly提供支持。https://vxtwitter.com/Adobe/status/1660964405893541888
Meta AI 新作品
- Massively Multilingual Speech
- 为 1,100 多种语言推出语音转文本、文本转语音等功能,语言转文本的错误率只有 Whisper 的一半
- 为 4000 多种语言训练的语言识别模型,仅有6.1%的错误率
- 使用连接时序分类CTC的技术,而不是LLMs
- 今天已经公开模型和代码,以方便其他研究者使用
- 在 wav2vec2.0 的基础上构建
- 使用了一个巧妙的宗教语言数据集:
- 目前最大的语音数据集仅涵盖100种语言
- 但是圣经等宗教文本已经被翻译而且有公开的录音
- 我们创建了包含1100+语言的圣经新约数据集,每种语言32小时的数据
- 在纳入其他基督教读物的无标签录音后,将可用语言数量增加到4000+
- 录音以男性为主,但是模型的男女性声音表现同样出色
- 录音是宗教内容,但模型并没有过度偏向宗教语言(还是有一点)
https://ai.facebook.com/blog/multilingual-model-speech-recognition/
https://ai.facebook.com/blog/wav2vec-20-learning-the-structure-of-speech-from-raw-audio/
App Store 美国区礼品卡购买地址,支持微信和支付宝
https://shop.pockyt.io/product?brand=App%20Store%20%26%20iTunes%20US
ChatGPT 的插件市场页面无法搜索插件,只能一页一页翻去查找自己可能需要的插件。
哥飞做了一个简单页面 www.ChatPlugin.top ,用中文向大家介绍所有插件。
可以在输入框输入你的需求,帮你从插件库中查找符合需求的插件。
也可以不输入,直接点搜索,会每次随机挑选一些插件给你。
点击任意一个插件,都能够看到跟这个插件类似的其它插件。
Tesla Bots 大军来了,它们跟随人类教练在现实环境中模仿行为、理解世界并完成复杂任务!尽管 OpenAI、DeepMind、Meta 还有 Nvidia 带领着 AI 在数字世界狂奔,但只有 Tesla 通过 FSD 让 AI 在现实世界的信息海洋中遨游 …
@elonmusk
认为 Tesla 将在 AGI 中发挥重要作用👀 https://vxtwitter.com/indigo11/status/1658608757453234176?s=20
100k 上下文的 Claude 已经可以在 https://poe.com/Claude-instant-100k 体验,会员每月可用100次,会员价20美金/月
Читать полностью…Google 的一堆产品需要在 lab 申请 waitlist,但是打开之后都提示你的账号还不支持 lab,今天终于找到问题所在。
解决办法是到 Google 账户里把自动添加的简体中文语言去掉,只留英文,并把自动添加语言功能关掉(就是被它坑了)。如图。
之后连上美国梯子,到这里申请吧
https://labs.withgoogle.com/
Stability AI正式发布了他们从文字生成动画的工具Stable Animation,感觉效果和能力类似于Gen-1,主要包括下面三种能力:
文本到动画:用户输入文本提示(与 Stable Diffusion 一样)并调整各种参数以生成动画。
文本输入+初始图像输入:用户提供初始图像作为动画的起点。文本提示与图像结合使用以产生最终输出动画。
输入视频 + 文本输入:用户提供初始视频作为动画的基础。通过调整各种参数,获得了最终的输出动画,该动画还由文本提示引导。
https://m.okjike.com/originalPosts/645d1483fd7c4754e60eb9f6?s=ewoidSI6ICI1NWY5Mzg0ZjVmMDJjYTE1MDA3YzA4NTMiCn0=
今天必将是 Google 刷屏的一天,我就说下重点吧:
1.PALM2相比PALM,模型参数更少,但是效果反而远超前代。实力科学炼丹。
2.在代码能力上和GPT4差距仍然巨大, 37/85的差距
3.Flan版本的数学能力超过GPT4一点点
4.除了代码和数学,还特别提升了推理能力
技术报告地址:
https://ai.google/static/documents/palm2techreport.pdf