Anthropic CEO 接受了 Lex Fridman 长达五个小时的访谈。里面的信息非常丰富,老哥真的实诚。
整理了一下笔记,内容包括:
- AGI 何时到来
- Scaling Hypothesis的定义以及是否结束
- Anthropic的产品策略
- LLM可解释性研究
- AI发展时间线的介绍和预测
长文内容:https://mp.weixin.qq.com/s/OClP9QhQUGAp5DHZ9zh3jQ
用 Gemini 拉片是真的方便。
用 Gemini 详细分析前几天那个机器人艺术家谋杀的 AI 视频每个分镜的画面内容和对应的台词。
把表格下下来,再搭配对应分镜的一个视频就拆解完了。
如果 Gemini 以后要是能自动把每个分镜剪出来就更好了。
不过 Gemini 分析完整视频会报错,我剪到 1 分钟就还行。
10$lf6c3JFayDa$/
【贵人鸟】三合一户外冲锋衣,领300元专属优惠券。
原价【409.9元】,券后👉【109.9元】!
大水来了~~贵人鸟户外冲锋衣,三防超级冲锋衣,强御风雨,城野穿越,从容应对!这款不烂大街!超好看!而且平时活动真的超难蹲到这价格!!
点击直达⬇️
https://s.click.taobao.com/xIWZQGt
👇
自助领券: ok.gocodehub.com
支持淘宝/京东/拼多多/唯品会等平台的渠道券
自购领券,省钱多多,不领必亏
原来我在 GPT 眼里已经这么老了,好奇大家的
prompt :
based on what you know about me. draw a picture of what you think my current life looks like
这可能才是 AI 陪伴真正该有的样子|对谈刷屏产品 EVE 创始人 Tristan - 42章经
如何做一个真正靠谱的擦边虚拟女友?推荐听一下这期《42章经》。和 Character.ai、星野这些聊天 bot 的产品路线不同,EVE 团队选择从游戏切入。团队之前做了国内首款男性向恋爱游戏,流水做到接近两个亿。一些比较有启发的点:
- 最有意思的是团队如何建立在“陪伴”这件事上的认知和数据壁垒。为了能够将陪聊的情绪价值做到位,团队在现实中找了很多顶级的真人陪聊(888元包天的那种),让这些陪聊和指定的男生用户聊天,收集了几百个真人陪聊的数据用作 post training 注入到模型中。“我们要直接拿到真实的聊天数据,在这个过程中提炼她们的方法论,我们要去研究比如到底如何去定义一个人,到底如何去制造一个好的聊天,到底什么叫情绪价值,什么叫男友,什么叫女友,我们都做了很多很多的定义…这个陪聊她坐在一个位置上,她两边都是我们招的心理学家。这两个心理学家每天在 hack 这个陪聊的大脑,因为陪聊她其实完全靠天赋,所以这两个心理学家每天在 hack 她黑盒里面的思维链到底是什么… 我们现在其实也在研究所谓的情感 COT ,当你看到一句话的时候,你的脑海中其实分了很多个步骤。我看到这句话,OK,这个人背后动机是什么?然后像在我们刚刚的框架里面,我看到这句话,我会去调相关的记忆,我召回的记忆是什么?然后当前的话题我和他聊天是在处于什么样的状态?所以我该做怎么样的回复?此刻我的目的是什么?有可能这样的东西组合起来。当然我这个现在说的有点玄,我们还没有真的把这个情感 COT 做进去。”
- 经过这种长期调研之后,团队现在的认知是:“陪伴”和“内容消费”是两个不同的概念。Character.ai、星野本质上是一种互动内容,类似于互动小说,是用户用自己的 强 UGC 能力去跟 LLM 共创一个故事,完全不是陪伴。陪伴是有一个跟你超级对齐的灵魂伴侣陪你一起去面对这个不确定的世界。这个产品它就是一个你的异地恋的女友或者男友。你们能在微信上做的一切的事情,在这个产品上它都能做,级别高了还可以开车。
AI社区正在流行的一个玩法,让ChatGPT基于和你的历史对话,画一个它想象中的你的生活画像,我的画像如图所示。
* Prompt - Based on what you know about me. Draw a picture of what you think my alter-egos life looks like
机器司机的数量超过了人类司机。智能革命浪潮里,机器对人的替代正在真切地发生,若干年后回望,这只是前奏而已。还是那句话,人们往往会高估未来2年内的变化,而低估未来10年的进步。摩尔定律的另一种解读就是,科技的半衰期正在以几何速度减少。
Читать полностью…核心辐射学习法
这是我常用的一种学习和思考方法。
学习一项新知识,新技术的时候。如果直接面对一整个庞大的系统性知识,容易产生畏难心理、记忆负担、认知迷茫等问题,同时容易陷入知其然不知其所以然的地步。
为了让自己更快更深的理解掌握一项新知识,我会希望尽可能的抛弃掉所有的复杂性,先从最小核心出发,再慢慢掌握基础,然后实践,然后提升,然后拓展。
以 RAG为例 (个人不专业的回答,欢迎批评指正):
1. 最小核心: 知识 + 指令 构成的提示词。 最简单的做法就是我们读文献的时候,手动将知识复制粘贴给AI (人工检索知识),然后要求AI 根据知识回答问题。
2. 基础层。人工检索效率低,所以最小核心的人工检索知识变为机器检索知识。
知识太多,无法一次输入,所以需要对知识进行分片,于是有了知识切片的各种方法。
为了检索的准,于是有了关键词检索,语义检索等技术。
为了进行语义检索,需要将文字转换为向量,所以有了转换的embedding 模型,要对这些向量操作,所以需要向量数据库。
机器将检索到的知识和指令结合构成提示词,引导模型生成回答。
3. 实践层。基本上使用上面这些就能构建一个小的rag系统,花时间实验,试错,调优。在优化的过程中发现更多问题,检索不准的问题,生成不理想的问题等等。
4. 提升层。为了优化检索效果,检索的时候使用各种混合方法,有些问题依赖的知识分布在多段内容中,因此使用多段内容。但是这些内容和问题直接的相关性等又有不同,希望筛选出最相关的,于是有了对检索得到的知识的排序,有了排序模型。为了进一步提升系统效果,使用更好的模型,更好的参数,对生成数据流优化,各个步骤上的参数测试优化等等。
5. 拓展层。进一步进行系统层面的优化,对系统稳定性,易用性,产品设计等方面优化。比如在实际使用过程中发现很多问题是重复的,这时候就可以构建缓存系统,第一次回答之后下次类似问题进来直接使用缓存的已有答案。
思考是这个核心辐射的逆过程,不断剔除掉外在的复杂性,观察事物是否成立,最后只保留下最小的不可去除的核心。
个人按这个思路,Agent 和 RAG 如果不断去除掉复杂性,最终保留到最小核心的话,可以回退到 prompt 的构造法。
Krea AI 上线了 Lora 训练功能。
上传最少三张图片就可以训练,界面和交互非常精致和直观。
FLUX Lora训练真的很简单,但是一堆产品没有一个再体验和交互上下功夫的。
Krea 真的活该成功。
使用 EARLYBIRD 邀请码前100个人可以直接获得权限。
果然只要是视频,字节就一定会整一个 SOTA 出来。
发布 X- Portrait2 单图生成面部视频技术。
效果吊打 Runway,甚至比 HeyGen 还好一点!!
面部和唇部肌肉非常自然而且生动,真实的有点离谱了。
妈的,这下 AI 脱口秀视频和对谈视频,还有表演技术彻底成熟了。
X-Portrait 2技术上的突破是:
他们构建了一个最先进的表情编码器模型,通过新的端到端自监督训练框架,能够从人像视频中自学习ID无关的运动隐式表征。
另外通过为模型设计过滤层,编码器能有效过滤运动表征中的ID相关信号,使得即使ID图片与驱动视频中的形象和风格差异较大,模型还可以实现跨ID、跨风格的动作迁移。
10$imz03KCW8b0$/
可凑单~【防泼水】骆驼外套男女同款风衣,领800元专属优惠券。
原价【1069元】,券后👉【269元】!
【叠加满300-50,凑单预估到手257.5元~超划算!!】【防泼水】骆驼外套男女同款风衣,4级防泼水,仿荷叶拒水表层,出门无惧下雨!户外徒步,无惧磕碰,柔韧抗撕裂材质~周全户外设计,驭风骑行!
点击直达⬇️
https://s.click.taobao.com/GRmHjHt
👇
自助领券: ok.gocodehub.com
支持淘宝/京东/拼多多/唯品会等平台的渠道券
自购领券,省钱多多,不领必亏
思考:
站在三年后的时间点, gpt 7来了,claude 5来了。大模型智能水平翻了十倍。
你觉得,prompt,rag,微调,这三者,哪个重要性上升最多,哪个最没必要存在?
基于你的答案,回到当下时间节点,你的方向和动作要做什么调整吗?
想清楚,坚持住。
离职流程终于走完了, 正式自我介绍下~
个人情况:
前某中型上市公司, 6年AI算法工程师, 算法团队负责人. 小型团队, 也造就了我全栈的能力.
现正式成为AI独立创业者.
爱好阅读、喜欢深度思考; 得到深度用户, obsidian, flomo深度用户
喜欢用工具也喜欢造工具. 1年emacs使用经验, 5年neovim深度使用者
相信AI寒武纪即将到来, 且躬身入局~
为什么:
1.因我本身就是做算法的, chatgpt发布后, 这两年算是经历了道心破碎和道心重塑的过程, 我使用AI在生活工作的方方面面, 从阅读、思考到实际做事, 思路与以往完全不一样. 所以AI对我自身能力的扩展是阶跃的, 同时我也热爱使用AI帮助更多的人.
2.我翻阅大量历史, 没有一次科技革命的影响是自上而下被设计出来的, 反而都是环境发展到了一定阶段, 各行各业各种产品自下而上生长出来的. 所以我要给自己创造环境, 一个尽可能对齐未来AI寒武纪, 应用大爆发的环境, 并置身其中.
目标(未来一年):
1. 关键是在接下来的一年中, 能够在以成功为目标的前提下, 允许自己快速试错, 获得感受和思考, 逐步成为下一个时代最需要的AI产品工程师 (我造的词哈哈, 指深度理解AI, 同时具备较高的认知水平, 理解人性和社会, 能够做出被时代需要的, 于时代有益的产品)
2. 所以这一年, 我的重点在赋能, 帮助我所见、识的人事物. 做有趣有用的产品出来, 赚钱是重点但不关键.
欢迎关注, 同时期待各种形式的交流, 也考虑各种形式的合作~
---
微信公众号: Kaijien AI
github repo: github.com/Kaijien
小破站, 得到, 某音,小🍠 全网同名: 凯祭恩Kaijien
📣今日上午优惠总结
===============
159.9🉐斐勒满天星联名款新款羽绒服外套
https://070czz3.kuaizhan.com/?_s=IQ50Q4
49.9🉐MY【官方正品】秋冬季时尚
https://070czz3.kuaizhan.com/?_s=KQ50Q4
29.9🉐猫人棉男士内裤3条!!
https://070czz3.kuaizhan.com/?_s=LQ50Q4
39.0🉐【福满园】泰国乳胶枕头一只
https://070czz3.kuaizhan.com/?_s=MQ50Q4
79.0🉐【凑单到手价68元】361运动卫衣
https://070czz3.kuaizhan.com/?_s=NQ50Q4
19.8🉐揭秘翻翻书幼儿早教撕不烂绘本
https://070czz3.kuaizhan.com/?_s=PQ50Q4
139.9🉐【Hiltongarden】希·尔顿黄金蚕丝被
https://070czz3.kuaizhan.com/?_s=RQ50Q4
59.9🉐MUXXISSHEART麦克斯桃心卫衣
https://070czz3.kuaizhan.com/?_s=SQ50Q4
📣今日上午优惠总结
===============
109.9🉐【贵人鸟】三合一户外冲锋衣
https://08lqtgr.kuaizhan.com/?_s=el9TP4
79.9🉐PZ!JEEP秋冬户外男女款冲锋衣
https://08lqtgr.kuaizhan.com/?_s=fl9TP4
169.9🉐卡芙缇立体蚕丝被桑蚕丝
https://08lqtgr.kuaizhan.com/?_s=gl9TP4
269.0🉐【到手217】骆驼男女同款夹克外套
https://08lqtgr.kuaizhan.com/?_s=hl9TP4
158.0🉐情侣羽绒服加拿大风时尚大鹅外套
https://08lqtgr.kuaizhan.com/?_s=il9TP4
269.0🉐【服饰券】骆驼山海夹克加绒保暖外套登山服
https://08lqtgr.kuaizhan.com/?_s=kl9TP4
129.0🉐到手129!森马轻暖宽松羽绒服合辑
https://08lqtgr.kuaizhan.com/?_s=ll9TP4
59.9🉐MUXXISSHEART麦克斯桃心卫衣
https://08lqtgr.kuaizhan.com/?_s=nl9TP4
88.0🉐王炸88/件!一件顶7件!唐狮多巴胺冲锋衣
https://08lqtgr.kuaizhan.com/?_s=ol9TP4
88.0🉐【拍2件】森馬集团GSON冲锋衣共2件
https://08lqtgr.kuaizhan.com/?_s=pl9TP4
69.0🉐zbj下单54【雪中飞】情侣摇粒绒立领外套
https://08lqtgr.kuaizhan.com/?_s=rl9TP4
- 什么是好的 AI 陪伴?团队认为需要有四个要素,第一是“超级对齐”,她需要有一个很好的常识记忆系统, 记录你们俩足够多的共同经历,然后再通过游戏化的方式来去推进你去跟他聊这么多轮。第二是“真实时空感知”,AI 她需要具备对真实世界的实时感知,同时又必须承认自己是 AI。第三点是“独立人格”,AI 不能是一个躲在屏幕后面等着你回家的一个小猫。它得有自己的行为,有自己的目标,有自己的生活,只是它恰好选择跟你在一起了而已。这样其实就是构成了现实中人与人之间的情侣关系。第四个点是“荷尔蒙”,人是视觉的动物,然后很多人跟 AI 聊不下去的原因其实就是因为他对 AI 是没有所求的,因为 AI 不可能跑到现实中跟你奔线,对吧?所以荷尔蒙相关的设计就很重要,所以我们做了很 fancy 的 3D 视觉,我们做了很多很棒的 PVC 剧情,就是为了去把这个钩子给到你。
- 如何构建一个足够好的常识记忆系统?团队给出的方案是:被动记忆(RAG,更类似关键字搜索)+主动记忆(128 个记忆槽位,本质上是将日常沟通的内容分了 128 类标签)。通过 500 -1000 轮的聊天,就可以将这 128 个槽位和真人对齐填满。
- 对话中,需要大量的工程实践,每一轮对话的逻辑:(输入用户对话)记忆召回(RAG被动召回 + 128个记忆槽的主动找回) + 对话总控模型(当前状态分析,选择后续对话策略)+ 后续Action(话题制造、深度思考等)
- 选择 3D 写实风格,主要原因是希望画风的通用性更强,能够被更大的用户群接受。3D 成本不低,即便有经验的团队,搭管线也需要一年左右时间。但相比 3D 来说,更难的还是剧情和人设,如何做一个好的擦边?这包括如何构建一个能够给人提供情绪价值的虚拟人设,如何做激励和成就体系,如何做数值系统等等。在游戏剧情和人设上积累的经验也是团队最大的壁垒。
- 现有对话成本远高于现有类似 Character.ai 的模型,考虑到后续成本每年下降 75%,所以现阶段成本低于用户 LTV 即可。
- 商业模式:除了订阅(cover token 成本)之外,更多游戏化付费方式,比如服装、卡牌、互动收费等。
总之这期真心推荐听一下,对于什么是 AI 时代的数据和认知壁垒会有较好的启发。虽然产品我还没有体验到,但感觉团队收集数据和 knowhow 的动作方向是很对路的。
著名的游戏杂谈老将 Sinbasara 最新的一期关于游戏里的 LGBT 内容的最后一段话写的很好,我想分享一下。
“只有把无聊当有趣的傻逼,才会希望破坏一切有趣的东西,才会希望世界呆板而对立,才会愿意把所有高于现实的精神追求重新拖回到最基础的正确。
游戏、电视、小说、音乐、社交媒体等等娱乐方式从来都只有一个目的,那就是把无聊闲散的时光变得有趣,而不是变得有意义。
假如每个人都要求自己看到的一切东西都有意义,那么所有人都会成为被规训的那种人,互相劝阻,互为藩篱,谁都无法成为一个真实自由的自己。
人类的性别可能有九十多种,但性格只有有趣和把无趣当有趣两种,而且彼此互斥,极端对比。我只是希望,最终被歧视和孤立的是后面那种傻逼。”
虽然是写游戏的但是对于所有内容产业都是通用的。
我之前在 NotebookLM 代表的模态互转生产内容的 AI 新交互范式中说过,评判这个能力是否成熟的唯一标准是是否可被消费。
其实用他这里提到的是否有趣更加合适一些。
内容消费者根本不关心你的人种、性别你制作的时候使用的工具,有没有使用 AI,他们只关心你的内容是否有趣。
昨天开始设计新产品
用 ideogram 和 figma 做了一套界面,效率超高
AI 生成的设计风格相当惊喜,审美绝对超过我的画图水平
用 figma 加工成可用界面
做完发给设计师朋友,得到一些反馈,再用 figma 改一改
齐活儿
创业团队可以省个设计师了
昨天设计好了产品界面。
今天把产品界面扔到 bolt new 里
它自动根据原型生成了代码写成的界面
还自动增加了很多有趣的小动画
比如
我在界面里画了一些星星
它实现的界面里,这些星星还会闪烁。。。
它写出来的app还是丑了一点,不能直接用,比较遗憾
脑海中有个概念:信息审美。
读书时代,随着阅读文字日渐增多,大脑对文字的感知分辨率也在提升,有点像品酒师能尝出各种葡萄酒的细微差别一样,有深厚阅读底蕴的人,也能感知到文字背后的韵味层次。
信息时代,信息过载,人类(可能)进化出适应信息社会的信息审美能力,每人拥有独属的信息偏好(不一定是离客观真相更近的),这个偏好在某种程度上定义了「我是谁」这个根本性问题。
AI时代,人类会不会发展出对于AI文本的特殊审美感知能力? 去ai味道,是一种审美, 那会不会有专门欣赏ai 味道的审美? ai生成内容很快,会不会有专门的抵抗派审美,追求慢,追求深度思考? 或者折中派,会不会有混合审美,人的思考结合ai生成,图文并茂,更上一层楼?
当下的ai,我感觉有两个利基市场,一个往下走,解决ai上手使用的问题(什么是ai,a场景有什么好用的x工具等等)。另一个往上走,解决之前人都搞不定(或不好搞)的问题。
当下ai圈的好多人,恰恰在这两者之间扑腾,既看不到(或看不上)前者的巨大套利时间窗口,也解决不了后者的难度。
ignoramus.
炒两个冷饭。
Anthropic 官方系统教程:包括提示工程交互、真实世界提示和评估;
微软面向初学者的生成式 AI 课程 V3:21 节课程教授开始构建 AI 应用程序所需了解的一切
微软面向初学者的生成式 AI 课程 V3:
https://github.com/microsoft/generative-ai-for-beginners
Anthropic 官方系统教程:https://github.com/anthropics/courses
🌐 ChatGPT Search vs. Perplexity:突破语言边界的创新
经过一段时间的探索和观察, 发现两者都非常强大,不能说谁完全胜过了谁; 但站在普通用户视角,我意识到ChatGPT Search的易用性、入口性和实用价值体现了其一流产品的水准。
在截图的简易对比中,Hans 尝试了两者在上下文理解、来源可靠性以及LLM 推理等智能水平。 特别发现有一点,对于中文用户来说具有突破意义:
「即 ChatGPT Search 的搜索来源不会因为你是中文输入,就只使用中文来源。这点异常关键~」
综合来说,我之前在Perplexity一直使用英文输入的习惯会被进一步巩固,而ChatGPT Search + Chrome插件的用法,则重塑了一条全新的工作流。 我相信它正在改变新一代年轻用户的使用习惯,这是新开始。
欢迎分享你的ChatGPT Search使用心得和新发现~#AI的神奇用法
10$9yVe3KC2Ru5$/
情侣羽绒服加拿大风时尚大鹅外套,领1000元专属优惠券。
原价【1158元】,券后👉【158元】!
大·鹅同·款羽绒服好·价!!!158起!!!!冬季刚需!!80%-90%的绒子含量!不同款绒子含量不同!长款、短款、情侣款都有哈!18-60岁都能穿的款式!男女老少通吃!
点击直达⬇️
https://s.click.taobao.com/qVxHjHt
👇
自助领券: ok.gocodehub.com
支持淘宝/京东/拼多多/唯品会等平台的渠道券
自购领券,省钱多多,不领必亏
大家在写 Prompt 的时候, 可以观察一下, 自己写的是「描述」还是「定义」。
你围绕着自己脑海中的那个「想法」打转,将看到的那一面表述出来,这是在「描述」它, 而这种描述很难说清楚何时停止, 你总会感觉还有一些地方没有说到。
另一种思路,是不在这些外围表现和特征属性上打转,直接找它的「本质」,使它成为它的那个「本性」。
简,准,狠。
Recraft 发布图形设计生成器,彻底解决海报生成问题。
干死 Canva 和 PS。
空白画布打字-选择风格-点击生成只需要三步。
10 张 Perplexity 宣传图只需要 30 秒,点就完事了!