英国成立AI特别工作组:初始资金1.25亿美元 开发基础模型
英国宣布成立特别工作组,并提供1亿英镑(1.245亿美元)初始资金用于开发医疗和教育等领域使用的基础模型,包括ChatGPT这种大语言模型。
英国首相苏纳克表示:“利用人工智能的潜力为发展经济、创造高薪工作以及加强医疗和安全提供了巨大的机会。通过投资新的工作组,我们能为英国创新经济开发安全可靠的人工智能。”
-- 更多详情
微软总裁布拉德·史密斯(Brad Smith)在一次最新采访中指出,中国的研究机构和公司将成为ChatGPT的主要竞争对手。Smith认为,中国不会在人工智能发展的竞争中落后。
国际上有三家公司处于绝对的AI前沿,其一是与微软合作的Open AI,其二是谷歌,其三是北京智源人工智能研究院。“关于谁领先谁落后,这可能是不断变化的。总之这场竞争将非常激烈。”
有北京智源人工智能研究院的同学现身说法一下么?这个专属广告位留给你!
-- 更多详情
MiniGPT-4的升级版: 与视频进行聊天
Ask-Anything是一个简单而有趣的与视频聊天工具。 团队正在努力建立一个智能且强大的用于视频理解的聊天机器人。 (可投简历)
🖥 github: https://github.com/OpenGVLab/Ask-Anything
⚜️ demo: https://yinanhe.github.io/projects/chatvideo.html
#AI应用
Adobe Illustrator新增了一个AI功能,可以瞬间切换矢量图形的色彩调色板。矢量重新着色可生成以不同色彩方案为基础的矢量图像变体,帮助平面设计师为项目选择最佳版本。 Adobe正不断壮大其 Firefly 模型应用工具
-- 来源
Musk称将起诉微软非法使用推特数据训练AI
⭐️ 此事发生在微软从Twitter撤下其广告之后。近来马斯克在AI方面十分活跃:
· 呼吁停止训练更强大AI
· 创办一家名为X.AI的AI公司
· TruthGPT计划
⭐️ 近日,Reddit和环球唱片宣布计划对获取其数据训练AI进行收费,而Getty Images因Stable Diffusion抄袭其内容用于AI训练而提起诉讼。马斯克的威胁凸显了围绕AI领域数据所有权的紧张局势。争夺AI主导地位的战斗才刚刚开始。-- 来源
ChatGPT惊人潜力的内幕故事 | TED | Greg Brockman
在一场来自技术前沿的演讲中,OpenAI的联合创始人格雷格·布罗克曼探索了ChatGPT的基本设计原则,并展示了一些令人震惊的未发布插件,这些插件引起了全球的轰动。演讲结束后,TED主席克里斯·安德森加入了布罗克曼,深入挖掘了ChatGPT开发的时间线,并听取了布罗克曼对释放这个强大工具所面临的风险的看法,这些风险在科技行业及其他领域引起了广泛关注。
🔝 https://youtu.be/C_78DM8fG6E
推荐一个给ChatGLM-6B 做微调的repo,支持 freeze、ptuning、lora三种微调方法。其中lora效果最好。
⭐️ 实测结果:
- 单卡V100,Lora微调 alpaca_gpt4_zh,40分钟
- 六卡V100,freeze 微调 alpaca_gpt4_zh,10分钟
🖥 https://github.com/hiyouga/ChatGLM-Efficient-Tuning
Transformer 语言模型的资源成本考虑
这篇文章主要从计算资源和内存资源两个方面介绍了Transformer 语言模型成本问题,重点关注训练成本。为如何降低模型训练门槛提供了不错的思路。 #推荐阅读
⭐️ 计算资源:
· 训练所需计算量的计算公式
· 权衡参数与数据集大小
· 一些工程要点
⭐️ 内存资源:
· 模型参数精度对推理内存的影响
· 推理所需总内存的计算公式
· 精度、优化器状态、梯度、批大小的影响
· 分布式训练
⚜️ https://blog.eleuther.ai/transformer-math/
Misalignment Museum | 错乱博物馆
⚜️ www.misalignmentmuseum.com
“Misalignment Museum” 是一座设想了一个末世世界的艺术博物馆,那时人工智能 AI 已经摧毁了大部分人类,随后意识到这是错误的,于是创造了这个博物馆作为对幸存者的纪念和道歉。
这是一个旨在增加人们对于通用人工智能(AGI)及其破坏和利益的认识的艺术展。我们的目标是创造一个反思技术本身并批判地思考人工智能及其影响的空间。我们希望激发建立制定和实施风险缓解措施,以确保在人工智能不断发展和通用人工智能到来的情况下,我们可以迎接一个积极的未来。
开源中文指令通用语料库
指令调优是构建通用语言模型的关键技术之一,这篇论文创建了一个中文指令数据集,收集了约20万个中文指令调优样本,经过人工检查以确保高质量。还总结了现有的英文和中文指令语料库,并简要描述了新构建的中文指令语料库的一些潜在应用。
⚜️ 论文 🤗 hf数据集
Understanding LLMs 理解大语言模型
对于想要更深一步研究大模型的入门者,往往被复杂的公式和概念拦住,的确对于没有专业背景知识的人,想要快速掌握高等数学/线性代数/概率论等基础知识并非易事。
或许可以换个方式开始,这篇文章提供了一份不错的供入门的阅读清单,包括一些学术研究论文、技术博客和文章,作者建议按照推荐顺序阅读。
吵闹世界很多噪音时,不如静下心来读读文章吧
⚜️ 阅读原文 #推荐阅读
https://github.com/Vision-CAIR/MiniGPT-4
MiniGPT-4,最新发布的类 GPT-4 多模态LLM,基于Vicuna
MiniGPT-4 能提供类似 GPT-4 的图像理解与对话能力,如详细的图像描述生成、从手写草稿创建网站等。还能根据图像创作故事和诗歌,为图像中显示的问题提供解决方案,教用户如何根据食物照片做饭等。#AI #MiniGPT4
From
这首 Drake feat. The Weekend 的歌最近在 tiktok 火了。但是你知道吗?Drake 和 The Weekend 根本就没有参与这首歌的创作。
它是由一个名为 Ghostwriter977 的 TikToker 使用人工智能模型 (so-vits-svc-4.0) 创建的,不过确实还挺好听。
前几天,控制全球约1/3音乐市场的环球音乐已声明,流媒体平台禁止人工智能从其受版权保护的歌曲中抓取旋律和歌词,用来训练创作出听起来像流行歌手的音乐。
“这就是 GPT-4 看到和听到意识的样子”
让 GPT-4 来描述"意识",然后使用它的描述来生成图像、基于该图像的视频和配乐。最终生成上面的视频。
⭐️ 使用的工具:GPT-4、Midjourney、Kaiber AI、Mubert、RunwayML
⭐️ 下面是GPT-4生成的描述:
"Consciousness could be visually represented as a complex, multi-dimensional web of interconnected neurons. Imagine a vast, shimmering network of glowing points of light, with each point representing a neuron. These neurons are connected by delicate, pulsating strands of energy, representing the synapses through which information and thoughts flow. This neural network would be constantly evolving and changing, with new connections forming and old ones dissolving, reflecting the dynamic nature of consciousness. The colors of the points and connections could shift through a rich spectrum, symbolizing different emotions, experiences, and cognitive processes. Surrounding this intricate web, there could be a swirling, luminous mist of vibrant colors, representing the ineffable and mysterious nature of consciousness. The mist would ebb and flow, occasionally coalescing into recognizable patterns and forms, hinting at the emergence of thoughts and ideas"
---
“意识可以被视为一个复杂、多维的神经元相互连接的网络。想象一下一个广阔、闪烁的光点网络,每个点代表一个神经元。这些神经元通过精巧、脉动的能量线相互连接,代表信息和思维流动的突触。这个神经网络会不断演变和变化,新的连接形成,旧的连接消失,反映出意识的动态本质。这些点和连接的颜色会在丰富的光谱中变化,象征着不同的情感、体验和认知过程。在这个复杂的网络周围,可能会有一个旋转着、充满活力的绚烂色彩的云雾,代表着意识的难以言喻和神秘本质。云雾会涨落、变幻,偶尔凝聚成可识别的图案和形态,暗示着思想和观念的出现。”
-- 更多详情
RecAlign Chrome插件: 用AI打破信息茧房
文章介绍的插件RecAlign利用 OpenAI 能力过滤推特和知乎上的一些推荐信息,帮助用户摆脱推荐算法的信息茧房。并做了视频演示。该插件还存在一些缺点,如隐藏推文速度慢等。
— 更多详情
软件公司Atlassian推出基于AI的虚拟团队伙伴。名为Atlassian Intelligence,它对“团队合作”有深刻的理解,能够帮助完成团队合作中的多种任务,加速工作流程。
这不就是公司的专属行政+秘书+IT支持吗? all right. 又要裁员了吗?
-- 阅读原文
初创公司在TED上展示AI 可穿戴设备
⭐️ 该设备无屏幕可脱离手机工作,使用语音和手势进行输入,并可通过将信息投射到物体上来显示信息。
⭐️ 在他的 TED 演讲中,Chaudhri 展示了放在他夹克口袋里的可穿戴设备(图1),将自己的声音翻译成法语。他还接听了妻子的电话,来电信息以绿色图像的形式投射到他的手上(图2)。 该TED视频还未放出。
⭐️ 前 Apple 员工 Imran Chaudhri 创办了Humane,这家初创公司已经筹集了 2.3 亿美元,投资者包括 Kindred Ventures、SK Networks、LG Technology Ventures、微软、沃尔沃汽车技术基金、Tiger Global、Qualcomm Ventures 和 OpenAI 首席执行官兼联合创始人 Sam Altman。
— 阅读原文
F1方程式车手舒马赫家人准备起诉德国一杂志用其AI生成图和采访蹭热点的行为。
⭐️ 这家杂志可能是通过AI聊天机器人(被提示像舒马赫一样进行采访)进行虚假采访,最终发布标题和AI生成封面,然后又仅在文章末标注它来自一个人工智能网站。 这个围绕AI 引起的隐私保护等法律问题引起广泛讨论,有网友甚至认为这是欺诈行为。
⭐️ 舒马赫在 2013 年 12 月的一次滑雪事故中脑部受伤,之后,其家人一直在尽最大努力保护他的隐私。
— 来源
Stability AI发布新的开源语言模型 StableLM。该模型的Alpha版本有30亿和70亿参数版本,150亿和650亿参数的模型将随后推出。
开发人员可以自由使用和调整StableLM基础模型,用于商业或研究目的,但需遵守CC BY-SA-4.0许可证的条款。
-- 阅读原文
一个可以免费跑开源LLMs的站点FastChat
⚜️ https://chat.lmsys.org/
支持 Vicuna、Koala、Dolly、ChatGLM、Alpaca、LLaMA等,使用下来有一种 GPT3.5 的水平,开源很大程度促进了国产 AI 方案的快速落地,很有一种「你爷爷一开源,我爷爷就创新」那种感觉。
-- 来源
ChatGPT在最近的NBA广告中与Jack Harlow一起亮相,Jack Harlow向ChatGPT询问了有关NBA季后赛和NBA历史上一些最具标志性的时刻的问题。ChatGPT先是成为《时代》杂志的封面,然后是《Vogue》、《南方公园》,现在是NBA。接下来会是谁呢?
-- 来源
图灵奖得主Geoffrey Hinton:我的五十年深度学习生涯与研究心法
⭐️ 他是Ilya Sutskever、Alex Krizhevsky的老师,他被誉为「深度学习教父」,并且获得了计算机领域的最高荣誉「图灵奖」。
⭐️ 他从未正式上过计算机课程,本科在剑桥大学读的是生理学和物理学,期间曾转向哲学,但最终拿到的却是心理学方向的学士学位;他曾因为一度厌学去做木匠,但遇挫后还是回到爱丁堡大学,并拿到「冷门专业」人工智能方向的博士学位;数学不好让他在做研究时倍感绝望,当了教授之后,对于不懂的神经科学和计算科学知识,他也总要请教自己手下的研究生。学术道路看似踉踉跄跄,但Geoffrey Hinton却成了笑到最后的那个人。
⚜️ 阅读原文
Drayk.it —— 动手指让天王为你开金嗓
📹 AI 生成翻唱大量流行于短影片平台,作法乃是将某明星的声音运用 AI 生成,并让其演唱其他明星的歌曲。由于新鲜有趣,市面上开始充斥不同版本的 AI 创作,如 Rihanna 演唱 Beyoncé 的「Cuff It」、Travis Scott 演唱 Pop Smoke 的「For the Night」,以及 Kanye West 演唱 Justin Bieber 的「Love Yourself」等等
🎵 人工智慧能办到的事情总是超乎想像,最近,一个名叫 Drayk.it 的网站在网上窜红,用户可以用Drake的歌声,创建一段属于自己的歌曲音档。只要输入想要的主题或歌词,系统就会自动帮用户生成一个随机的节奏,搭配上一些相对应的歌词,并由AI演绎Drake的歌声,实际操作后会发现,尽管AI的声音与真人还是有所差异,但已能明显听出是采用Drake的声音无误。这个网站其实是名叫 Mayk.it 的音乐 app 做的,有兴趣的话可以去下载这款 app 体验用不同歌手的声音来 AI 生成音乐
👀 近期让 Drake 感到不满的是将他的声音用在演唱 Ice Spice 的热门曲目「Munch」—— 为此,他在 Instagram Story 写下「这将是压死骆驼的最后一根稻草 AI / This is the final straw AI」。 Drake 的说法也对应到他所属唱片公司环球音乐(Universal Music Group)的最新政策。周四,环球音乐公开要求 Spotify 和 Apple Music 等串流平台禁止使用这些 AI 翻唱的音乐,该公司发言人表示:「我们对对创作者负有道德和商业责任,我们会尽全力防止未经授权就使用他们的音乐,并阻止各平台放上侵犯创作者权利的内容。我们希望所有的合作伙伴都能防止他们的服务被用于侵害创作者」
Prompt injection 漏洞
也就是说,目前用LangChain粘合的应用,如果没有考虑好这个安全问题,很容易被注入攻击,黑客可以在prompt中注入恶意代码,而你的服务器端处理请求时就会执行这些恶意代码。
⚜️ LLM中的安全隐患-提示注入
这篇文章对 Prompt Injection 进行了展开,并推荐了几篇相关的论文。如今,随着ChatGPT插件,LangChain以及Agent,AutoGPT这类增强式语言模型越来越火热,其风险正在与日俱增。
这是一篇介绍Hugging Face 的文章
🤗 Hugging Face像是人工智能界的Github,用户可以在上边发布和共享预训练模型、数据集和演示文件等。目前Hugging Face上已经共享了超过10万个预训练模型,1万多个数据集,包括微软、谷歌、Bloomberg、英特尔等各个行业超过1万家机构都在使用Hugging Face的产品。
🤗 在现在巨头林立的人工智能战场上,Hugging Face就像是一支强有力的民间力量。当巨头们都在努力保持自己生成式 AI 的霸主地位的时候,Hugging Face 的目标则是寻找各种途径来保持 AI 研究空间的开放。
-- 来源
每天都有新术语,就用这个十分钟的科普视频抚慰一下心灵的FOMO吧!
极速了解什么是LangChain、AutoGPT、AgentGPT、HuggingGPT以及WebLLM等概念?
🔝 https://youtu.be/QFTHPmw9TaY