首页组件我要求包括但不限于:1.Hero 2.cta 3.faq 4.how it works....”
✅6.最重要的一点,你和cursor对话的时候通常会开多个聊天框(看图4右侧滑动按钮我完成这个项目开了多少聊天框),一个聊天框聊的东西多了就特别容易抽风,怎么保持让cursor的记忆同步呢?
每聊完一个聊天框,你要开启新聊天框的时候,就和cursor说:“请你回顾我们前面全部对话,总结更新我的项目架构文件,供未来别的开发人员使用“
✅7.总结:
cursor很强大,也很弱,取决于你会不会使用。
我前端是用next.js,后端用python,中间还涉及一些我从来没有接触过的服务器,命令行等运行命令。你一定要把前提和背景告诉cursor,举个简单的例子,我要在hugging face space上部署项目,但是发现服务器启动的时候日志疯狂报错,你千万不要直接把报错日志丢给cursor,这样子解决不了问题,你要这样说:“这是我部署到hugging face space服务器的时候的错误日志,请你看一遍,然后你告诉我可能是哪里出了问题,需要我提供哪些代码文件给你,我嗯先不急着写代码,先一起讨论下”
希望对大家有帮助,以后还会继续分享我在实战中使用cursor的经验。我是完全0代码基础,我可以,你一样可以,不要对未知的技术畏惧,不懂的就耐心去问cursor
Bolt New 的产品和销售数据出来了!
- 4周时间,从0到400万美金的 ARR!
- 使用的 Claude API 消耗量每天翻倍式增长
- 每周有十万人持续使用
这种爆发式的增长,核心是因为它解决了一个一直以来的行业难题:
Web 是世界上使用最广泛的平台,但开发者却无法在浏览器中构建 Web 应用。
通过开创性的 WebContainers 技术和先进的 AI Coder 解决了这个问题。
Bolt 认为未来人人都是开发者,十亿级别的开发者!
一个现实的例子是,一位用户在 Upwork 上获得了 5000 美元的报价和 2-3 个月的时间来打造她的 MVP。几天后 Bolt 发布,她购买了 50 美元/月的计划,并在不到 2 周的时间内构建并推出了她的产品。
引用链接:https://www.anthropic.com/customers/stackblitz
字节的通用图像编辑模型 SeedEdit 发布了。之所以说是编辑模型,因为可以基于刚刚生成的图片改图,包括修图、换装、美化、转化风格、在指定区域添加删除元素等各类编辑操作。
跟普通的编辑最大的区别是自然语言交流。我试用了一下,相当顺畅。自然语言驱动的编辑在业内还是少见的,尤其考虑到豆包本就是目前最有影响力的 AI 通用产品之一,这次可能会真的影响很多人设计的方式。
我之前用 Midjourney,跟很多朋友一样,急迫需要连贯性一致性的绘制形式,可以满足长篇的连贯的设计表达,比如做出有同个主人公的漫画、同类海报的不同呈现等等。
在豆包的官网 doubao.com 能体验到,大家可以试试看。
刚刚国内的一个做网文的客户看了下效果,表示满意。
然后,他们公司把这个程序买下来了……
有点夸张,但是真的……
感谢AI赏饭吃,本周加鸡腿。
把我整理出来的prompt分享给大家吧:
视角:视角为上帝视角,读者知道每个人物的行为动机,和心里活动。
读者群体:15到25岁的少女或者女性群体,晋江网站的读者
文风:幽默风趣,俏皮,充满着女性的可爱和柔美
段落风格:多换行,少用长句子,多用对话推进情节,避免过多的解释
情节:可以按照你的理解增加新的故事情节,如果你觉得当前的情节不足以支撑过多的字数情节,你可以按照你的理解来丰富内容,甚至创造新的支线剧情
避免重复:不仅避免相同的句子、情节、对话、场景描述和情感表达,还要确保任何重复的信息都能有所不同地呈现,以增加故事层次感,减少冗余感。
剧情快速推进:在每一章或每一个重要场景中,确保有推动情节发展的事件或决策。减少缓慢的内心独白或背景介绍,通过角色的行动和对话来展示故事关键要素。
连贯无断层:每个情节的承接点应自然流畅,从一个场景进入下一个场景时,合理描述事件或情绪的变化,避免突然的情节转折让读者感到突兀。
起承转合清晰:在每个段落或章节中,设置小的高潮和转折,并为主要情节做好铺垫,使读者能够循序渐进地融入情节发展。
无意义的对话和场景减少:确保每一句对话、每一个场景都具有明确的情节功能(推动情节或展现角色性格)。无实质内容的对话避免出现,每一场景的描写都应紧扣情节或人物发展。
多换行、少用长句:增加视觉上的“喘息”空间,使用短句增强节奏感。在描述情绪时用简练的词汇,不冗长,保证阅读时顺畅。
语言流畅自然:选用简洁明了的现代用词,减少过多修饰,避免用过于冗杂或华丽的语言,特别是在紧张的情节或情绪描写中。
情感和情绪的准确表达:用更直接、精准的方式表达人物情绪,避免含糊或过于抽象的情感表述。情感逐步递进,增加人物情感的张力。
视觉与情境感的渲染:在环境描写中,用简洁而富有画面的文字,将场景“画”出来,使读者更容易融入。
阿里开源了 Qwen2.5-Coder-32B 代码模型。
代码能力超过了 4o,接近 Claude 3.5
整个系列还有 0.5B / 1.5B / 3B / 7B / 14B 几个规格。
另外提供了常见格式的量化模型。
还有一个类似 Claude Artifacts 的工具被开源,可以去玩玩。
详细信息:https://qwenlm.github.io/blog/qwen2.5-coder-family/
📣今日上午优惠总结
===============
159.9🉐斐勒满天星联名款新款羽绒服外套
https://070czz3.kuaizhan.com/?_s=IQ50Q4
49.9🉐MY【官方正品】秋冬季时尚
https://070czz3.kuaizhan.com/?_s=KQ50Q4
29.9🉐猫人棉男士内裤3条!!
https://070czz3.kuaizhan.com/?_s=LQ50Q4
39.0🉐【福满园】泰国乳胶枕头一只
https://070czz3.kuaizhan.com/?_s=MQ50Q4
79.0🉐【凑单到手价68元】361运动卫衣
https://070czz3.kuaizhan.com/?_s=NQ50Q4
19.8🉐揭秘翻翻书幼儿早教撕不烂绘本
https://070czz3.kuaizhan.com/?_s=PQ50Q4
139.9🉐【Hiltongarden】希·尔顿黄金蚕丝被
https://070czz3.kuaizhan.com/?_s=RQ50Q4
59.9🉐MUXXISSHEART麦克斯桃心卫衣
https://070czz3.kuaizhan.com/?_s=SQ50Q4
📣今日上午优惠总结
===============
109.9🉐【贵人鸟】三合一户外冲锋衣
https://08lqtgr.kuaizhan.com/?_s=el9TP4
79.9🉐PZ!JEEP秋冬户外男女款冲锋衣
https://08lqtgr.kuaizhan.com/?_s=fl9TP4
169.9🉐卡芙缇立体蚕丝被桑蚕丝
https://08lqtgr.kuaizhan.com/?_s=gl9TP4
269.0🉐【到手217】骆驼男女同款夹克外套
https://08lqtgr.kuaizhan.com/?_s=hl9TP4
158.0🉐情侣羽绒服加拿大风时尚大鹅外套
https://08lqtgr.kuaizhan.com/?_s=il9TP4
269.0🉐【服饰券】骆驼山海夹克加绒保暖外套登山服
https://08lqtgr.kuaizhan.com/?_s=kl9TP4
129.0🉐到手129!森马轻暖宽松羽绒服合辑
https://08lqtgr.kuaizhan.com/?_s=ll9TP4
59.9🉐MUXXISSHEART麦克斯桃心卫衣
https://08lqtgr.kuaizhan.com/?_s=nl9TP4
88.0🉐王炸88/件!一件顶7件!唐狮多巴胺冲锋衣
https://08lqtgr.kuaizhan.com/?_s=ol9TP4
88.0🉐【拍2件】森馬集团GSON冲锋衣共2件
https://08lqtgr.kuaizhan.com/?_s=pl9TP4
69.0🉐zbj下单54【雪中飞】情侣摇粒绒立领外套
https://08lqtgr.kuaizhan.com/?_s=rl9TP4
- 什么是好的 AI 陪伴?团队认为需要有四个要素,第一是“超级对齐”,她需要有一个很好的常识记忆系统, 记录你们俩足够多的共同经历,然后再通过游戏化的方式来去推进你去跟他聊这么多轮。第二是“真实时空感知”,AI 她需要具备对真实世界的实时感知,同时又必须承认自己是 AI。第三点是“独立人格”,AI 不能是一个躲在屏幕后面等着你回家的一个小猫。它得有自己的行为,有自己的目标,有自己的生活,只是它恰好选择跟你在一起了而已。这样其实就是构成了现实中人与人之间的情侣关系。第四个点是“荷尔蒙”,人是视觉的动物,然后很多人跟 AI 聊不下去的原因其实就是因为他对 AI 是没有所求的,因为 AI 不可能跑到现实中跟你奔线,对吧?所以荷尔蒙相关的设计就很重要,所以我们做了很 fancy 的 3D 视觉,我们做了很多很棒的 PVC 剧情,就是为了去把这个钩子给到你。
- 如何构建一个足够好的常识记忆系统?团队给出的方案是:被动记忆(RAG,更类似关键字搜索)+主动记忆(128 个记忆槽位,本质上是将日常沟通的内容分了 128 类标签)。通过 500 -1000 轮的聊天,就可以将这 128 个槽位和真人对齐填满。
- 对话中,需要大量的工程实践,每一轮对话的逻辑:(输入用户对话)记忆召回(RAG被动召回 + 128个记忆槽的主动找回) + 对话总控模型(当前状态分析,选择后续对话策略)+ 后续Action(话题制造、深度思考等)
- 选择 3D 写实风格,主要原因是希望画风的通用性更强,能够被更大的用户群接受。3D 成本不低,即便有经验的团队,搭管线也需要一年左右时间。但相比 3D 来说,更难的还是剧情和人设,如何做一个好的擦边?这包括如何构建一个能够给人提供情绪价值的虚拟人设,如何做激励和成就体系,如何做数值系统等等。在游戏剧情和人设上积累的经验也是团队最大的壁垒。
- 现有对话成本远高于现有类似 Character.ai 的模型,考虑到后续成本每年下降 75%,所以现阶段成本低于用户 LTV 即可。
- 商业模式:除了订阅(cover token 成本)之外,更多游戏化付费方式,比如服装、卡牌、互动收费等。
总之这期真心推荐听一下,对于什么是 AI 时代的数据和认知壁垒会有较好的启发。虽然产品我还没有体验到,但感觉团队收集数据和 knowhow 的动作方向是很对路的。
著名的游戏杂谈老将 Sinbasara 最新的一期关于游戏里的 LGBT 内容的最后一段话写的很好,我想分享一下。
“只有把无聊当有趣的傻逼,才会希望破坏一切有趣的东西,才会希望世界呆板而对立,才会愿意把所有高于现实的精神追求重新拖回到最基础的正确。
游戏、电视、小说、音乐、社交媒体等等娱乐方式从来都只有一个目的,那就是把无聊闲散的时光变得有趣,而不是变得有意义。
假如每个人都要求自己看到的一切东西都有意义,那么所有人都会成为被规训的那种人,互相劝阻,互为藩篱,谁都无法成为一个真实自由的自己。
人类的性别可能有九十多种,但性格只有有趣和把无趣当有趣两种,而且彼此互斥,极端对比。我只是希望,最终被歧视和孤立的是后面那种傻逼。”
虽然是写游戏的但是对于所有内容产业都是通用的。
我之前在 NotebookLM 代表的模态互转生产内容的 AI 新交互范式中说过,评判这个能力是否成熟的唯一标准是是否可被消费。
其实用他这里提到的是否有趣更加合适一些。
内容消费者根本不关心你的人种、性别你制作的时候使用的工具,有没有使用 AI,他们只关心你的内容是否有趣。
昨天开始设计新产品
用 ideogram 和 figma 做了一套界面,效率超高
AI 生成的设计风格相当惊喜,审美绝对超过我的画图水平
用 figma 加工成可用界面
做完发给设计师朋友,得到一些反馈,再用 figma 改一改
齐活儿
创业团队可以省个设计师了
昨天设计好了产品界面。
今天把产品界面扔到 bolt new 里
它自动根据原型生成了代码写成的界面
还自动增加了很多有趣的小动画
比如
我在界面里画了一些星星
它实现的界面里,这些星星还会闪烁。。。
它写出来的app还是丑了一点,不能直接用,比较遗憾
脑海中有个概念:信息审美。
读书时代,随着阅读文字日渐增多,大脑对文字的感知分辨率也在提升,有点像品酒师能尝出各种葡萄酒的细微差别一样,有深厚阅读底蕴的人,也能感知到文字背后的韵味层次。
信息时代,信息过载,人类(可能)进化出适应信息社会的信息审美能力,每人拥有独属的信息偏好(不一定是离客观真相更近的),这个偏好在某种程度上定义了「我是谁」这个根本性问题。
AI时代,人类会不会发展出对于AI文本的特殊审美感知能力? 去ai味道,是一种审美, 那会不会有专门欣赏ai 味道的审美? ai生成内容很快,会不会有专门的抵抗派审美,追求慢,追求深度思考? 或者折中派,会不会有混合审美,人的思考结合ai生成,图文并茂,更上一层楼?
当下的ai,我感觉有两个利基市场,一个往下走,解决ai上手使用的问题(什么是ai,a场景有什么好用的x工具等等)。另一个往上走,解决之前人都搞不定(或不好搞)的问题。
当下ai圈的好多人,恰恰在这两者之间扑腾,既看不到(或看不上)前者的巨大套利时间窗口,也解决不了后者的难度。
ignoramus.
秉承Build in Public,分享下使用Cursor实战开发一个前后端分离的网站的经验,希望对大家有帮助,有问题评论区留言,我看到会回复
✅1.明确技术栈
Cursor中模型我选的是cluade 3.5 sonnet,openai用过就知道根本没法比。拿到一个需求,首先让claude推荐能实现这个需求的技术栈,然后在cursor setting全局配置中的Rules(图1)和项目根目录的.cursorrules中包含对应的技术栈,这个网页中有很多cursorrule的模版,我就是在里面找的https://cursor.directory/
✅2.设计架构,逐一实现(图2)
就和写作文一样,你要先写一个大纲,然后根据大纲填入对应的内容
千万别上来就和cursor说我要你帮我实现一个文生图网站,人工智能不是神。
你就是架构师,cursor就是程序员,我通常会这样对cursor说:“好的,让我们一起来实现这个需求。你先把整体的架构列给我,先不要写代码”
然后cursor列出架构后,你根据自己的需要,增加或者减少
✅3.遇到报错保持耐心,运用好command+回车(macOS, windows我不知道是什么)
command+回车在cursor里面是可以让cursor阅读你当前项目的全部文件。像我这次项目代码特别多,光api的文件就7个还是8个。(图3)
我举个例子,比如有生成图片api,生成音频api,提取pdf文件api,如果你添加了某个功能代码开始报错或者进行本地调试怎么都运行不了,你可以这样子和cursor说:”现在我们遇到了一个报错,控制台日志如下:xxxx,你先不要急着写代码,先分析下可能是哪些文件中的代码出了问题,告诉我需要提供代码的文件,你再修改”
✅4.如果遇到要修改现有文件的代码,一定一定要给cursor这个提示:“先阅读一遍我目前的代码,再进行修改”,你不这样说,cursor可能不知道你目前代码的结构,把你关键功能直接改没了都可能
✅5.前端页面如何快速实现?
你可以选择上v0.dev或者别的文生图,生成一个界面的图片,再发给claude让你复刻。我对界面没什么要求,我就是这样提示cursor的:“我们的网站主题是ai播客生成,我希望整体的设计风格是充满活力和激情的,请你以此基础发挥想象力设计我的ui界面。
我的第一个产品:Ai播客生成器现在上线了!
地址 https://mypodmates.com/
这是一个你可以放入PDF或网页,自动生成双人对话的播客。你会看到有两个ai机器人在对你输入的内容进行聊天和讨论
✅核心内容:
1.PDF分析:目前最高支持上传15-20页,5M以内的文件
2.网页分析:上传网页链接,分析网页内容
3.问题导向:可以输入你想重点聊的话题,比如放入一篇关于苹果简介的pdf文档,想重点关注苹果的生产地有哪些,播客内容会重点围绕这部分
❌待提升:
1.目前只支持英文,多语言(包括中文)未来可能放入,主要看用户反馈,不知道中文需求多不多
2.语音生成能力待提高:现在已经找到了更好的语音生成模型和解决方案,打算先收集一下用户反馈
3.PDF更长的文件支持
由于成本问题,我自己也是今年刚毕业,没什么储蓄,所以目前新用户免费赠送2次生成音频的额度,如果有更多的使用需求欢迎付费。关于产品的任何反馈或者疑问也欢迎向我提出
最后感谢:
GitHub开源库:https://github.com/meta-llama/llama-recipes
感谢豆哥的社群技术支持@艾逗笔
感谢飞哥的社群seo支持@哥飞
还有感谢一些路上为我排忧解难的朋友,太多了就不一一艾特了。
10$7fus3rRwgLA$/
假两件【连帽棉服!】男女情侣同款连帽棉袄,领500元专属优惠券。
原价【599元】,券后👉【99元】!
王炸组合!硬核爆品!超级羽绒棉服+卫衣组合来了,专柜价五百多!我们破价冲量商场同款一件500多!太炸了吧从容应多变气候,两件件N种穿搭变化!全天候全场景可穿!高级货白菜价,快锁库存,男女同款!冲!!手慢无!
点击直达⬇️
https://s.click.taobao.com/SKeQ1Gt
👇
自助领券: ok.gocodehub.com
支持淘宝/京东/拼多多/唯品会等平台的渠道券
自购领券,省钱多多,不领必亏
我回来了~
因为一连贯的原因,在去年11月脱离了AI这股浪潮
甚至为了节约精力,主动切割了和这个行业的联系
期间的忙碌和疲惫尚可切磋,但时不我与的感觉可真不好受
沉舟侧畔千帆过,不是沉舟竟过千帆,而是千帆已过,你却陷于沉舟
好在还有病树床头万木春的下半场,还能有杯酒长精神的意气
重新入学,重新开始,马丁3.0
顺便,谁能告诉我,最近一年,AI最大的进展是啥?
除了字节杀入了几乎所有领域以外(这一年里最放不下我的就是字节的猎头了)
过去一年半做了多个AI项目,有简单有复杂的,有面向超大规模的小白用户,也有面向垂类人群,其中prompt是非常核心的要素,也是大家在做项目时绕不开的逻辑。在此总结了做prompt方案设计的经验和教训
核心结论:
GenAI带来应用新范式,支持通过prompt生成优质的个性化结果,但大众用户不想打开键盘,也不知道填什么prompt,所以需要在保证最终效果的前提下,尽可能通过低成本的表达方式来获得用户的意图。
对话式交互是未来,但目前还无法取代传统图形化交互。
1. 交互:不要让prompt变成操作阻力
- 非必要,勿填prompt,让用户多填一个字,都是对用户规模和转化率的巨大折损;
- 如果有prompt的效果更好,那么把prompt做成选填,让专业用户有选择,又不影响小白用户的使用路径;或者首次不填,快速预览结果,后续深度使用再填
- 如果必须填,尽可能填用户不需要额外思考的,否则用户一思考,数据就掉
- 通过推荐词降低输入门槛,并保证对prompt的响应,避免拔高用户预期后但结果又不符预期
2. 信息:通过算法、或信息授权方式来获取用户意图和context背景信息,而不一定要手动输入
3. 流程:把prompt填写留在最后一步,让用户先完成简单的熟悉的操作,增加沉没成本
4. 生态:少数偏专业用户的prompt,沉淀在端内成为模板流转,服务更广大小白用户一键套用和二创。对工具产品来说,飞轮逻辑可能比漏斗逻辑更重要,因为效果比效率更重要。要站在整个平台,整个大生态去思考,从更长周期看对用户的价值,对平台的增长和商业化的价值
提示:
- 我是在一个已有的大体量的移动互联网产品中融入AI能力,用户的习惯、预期,以及业务指标护栏都会对新方案的设计做限制
- 以上交互案例是表象,数据也是表象,仅供参考,不一定能复用到其他产品
- 最重要的是,你的用户是谁,他们的需求是什么,你的产品当前处于什么领域、什么阶段,如何更好的满足他们的需求
Anthropic CEO 接受了 Lex Fridman 长达五个小时的访谈。里面的信息非常丰富,老哥真的实诚。
整理了一下笔记,内容包括:
- AGI 何时到来
- Scaling Hypothesis的定义以及是否结束
- Anthropic的产品策略
- LLM可解释性研究
- AI发展时间线的介绍和预测
长文内容:https://mp.weixin.qq.com/s/OClP9QhQUGAp5DHZ9zh3jQ
用 Gemini 拉片是真的方便。
用 Gemini 详细分析前几天那个机器人艺术家谋杀的 AI 视频每个分镜的画面内容和对应的台词。
把表格下下来,再搭配对应分镜的一个视频就拆解完了。
如果 Gemini 以后要是能自动把每个分镜剪出来就更好了。
不过 Gemini 分析完整视频会报错,我剪到 1 分钟就还行。
10$lf6c3JFayDa$/
【贵人鸟】三合一户外冲锋衣,领300元专属优惠券。
原价【409.9元】,券后👉【109.9元】!
大水来了~~贵人鸟户外冲锋衣,三防超级冲锋衣,强御风雨,城野穿越,从容应对!这款不烂大街!超好看!而且平时活动真的超难蹲到这价格!!
点击直达⬇️
https://s.click.taobao.com/xIWZQGt
👇
自助领券: ok.gocodehub.com
支持淘宝/京东/拼多多/唯品会等平台的渠道券
自购领券,省钱多多,不领必亏
原来我在 GPT 眼里已经这么老了,好奇大家的
prompt :
based on what you know about me. draw a picture of what you think my current life looks like
这可能才是 AI 陪伴真正该有的样子|对谈刷屏产品 EVE 创始人 Tristan - 42章经
如何做一个真正靠谱的擦边虚拟女友?推荐听一下这期《42章经》。和 Character.ai、星野这些聊天 bot 的产品路线不同,EVE 团队选择从游戏切入。团队之前做了国内首款男性向恋爱游戏,流水做到接近两个亿。一些比较有启发的点:
- 最有意思的是团队如何建立在“陪伴”这件事上的认知和数据壁垒。为了能够将陪聊的情绪价值做到位,团队在现实中找了很多顶级的真人陪聊(888元包天的那种),让这些陪聊和指定的男生用户聊天,收集了几百个真人陪聊的数据用作 post training 注入到模型中。“我们要直接拿到真实的聊天数据,在这个过程中提炼她们的方法论,我们要去研究比如到底如何去定义一个人,到底如何去制造一个好的聊天,到底什么叫情绪价值,什么叫男友,什么叫女友,我们都做了很多很多的定义…这个陪聊她坐在一个位置上,她两边都是我们招的心理学家。这两个心理学家每天在 hack 这个陪聊的大脑,因为陪聊她其实完全靠天赋,所以这两个心理学家每天在 hack 她黑盒里面的思维链到底是什么… 我们现在其实也在研究所谓的情感 COT ,当你看到一句话的时候,你的脑海中其实分了很多个步骤。我看到这句话,OK,这个人背后动机是什么?然后像在我们刚刚的框架里面,我看到这句话,我会去调相关的记忆,我召回的记忆是什么?然后当前的话题我和他聊天是在处于什么样的状态?所以我该做怎么样的回复?此刻我的目的是什么?有可能这样的东西组合起来。当然我这个现在说的有点玄,我们还没有真的把这个情感 COT 做进去。”
- 经过这种长期调研之后,团队现在的认知是:“陪伴”和“内容消费”是两个不同的概念。Character.ai、星野本质上是一种互动内容,类似于互动小说,是用户用自己的 强 UGC 能力去跟 LLM 共创一个故事,完全不是陪伴。陪伴是有一个跟你超级对齐的灵魂伴侣陪你一起去面对这个不确定的世界。这个产品它就是一个你的异地恋的女友或者男友。你们能在微信上做的一切的事情,在这个产品上它都能做,级别高了还可以开车。
AI社区正在流行的一个玩法,让ChatGPT基于和你的历史对话,画一个它想象中的你的生活画像,我的画像如图所示。
* Prompt - Based on what you know about me. Draw a picture of what you think my alter-egos life looks like
机器司机的数量超过了人类司机。智能革命浪潮里,机器对人的替代正在真切地发生,若干年后回望,这只是前奏而已。还是那句话,人们往往会高估未来2年内的变化,而低估未来10年的进步。摩尔定律的另一种解读就是,科技的半衰期正在以几何速度减少。
Читать полностью…核心辐射学习法
这是我常用的一种学习和思考方法。
学习一项新知识,新技术的时候。如果直接面对一整个庞大的系统性知识,容易产生畏难心理、记忆负担、认知迷茫等问题,同时容易陷入知其然不知其所以然的地步。
为了让自己更快更深的理解掌握一项新知识,我会希望尽可能的抛弃掉所有的复杂性,先从最小核心出发,再慢慢掌握基础,然后实践,然后提升,然后拓展。
以 RAG为例 (个人不专业的回答,欢迎批评指正):
1. 最小核心: 知识 + 指令 构成的提示词。 最简单的做法就是我们读文献的时候,手动将知识复制粘贴给AI (人工检索知识),然后要求AI 根据知识回答问题。
2. 基础层。人工检索效率低,所以最小核心的人工检索知识变为机器检索知识。
知识太多,无法一次输入,所以需要对知识进行分片,于是有了知识切片的各种方法。
为了检索的准,于是有了关键词检索,语义检索等技术。
为了进行语义检索,需要将文字转换为向量,所以有了转换的embedding 模型,要对这些向量操作,所以需要向量数据库。
机器将检索到的知识和指令结合构成提示词,引导模型生成回答。
3. 实践层。基本上使用上面这些就能构建一个小的rag系统,花时间实验,试错,调优。在优化的过程中发现更多问题,检索不准的问题,生成不理想的问题等等。
4. 提升层。为了优化检索效果,检索的时候使用各种混合方法,有些问题依赖的知识分布在多段内容中,因此使用多段内容。但是这些内容和问题直接的相关性等又有不同,希望筛选出最相关的,于是有了对检索得到的知识的排序,有了排序模型。为了进一步提升系统效果,使用更好的模型,更好的参数,对生成数据流优化,各个步骤上的参数测试优化等等。
5. 拓展层。进一步进行系统层面的优化,对系统稳定性,易用性,产品设计等方面优化。比如在实际使用过程中发现很多问题是重复的,这时候就可以构建缓存系统,第一次回答之后下次类似问题进来直接使用缓存的已有答案。
思考是这个核心辐射的逆过程,不断剔除掉外在的复杂性,观察事物是否成立,最后只保留下最小的不可去除的核心。
个人按这个思路,Agent 和 RAG 如果不断去除掉复杂性,最终保留到最小核心的话,可以回退到 prompt 的构造法。