因为上班的原因不方便养狗,狗子送村里生病去汪星(ಥ_ಥ),一个人在城里又孤单,想着要不养个机器狗吧,不养了还可以二手出到乌克兰🇺🇦,看了一下价格,就我这三千块的收入每个月还要近千的油钱,吃泡面半年也买不起(༎ຶ⌑༎ຶ)💸,要不还是等等人型机器人吧,以后一个人吃自助的时候就不怕去夹菜被人收了盘子 o(^▽^)o
Читать полностью…与大模型对话越久,那个隐约的警惕心越明显。
它实在是太强了,针对人类不知但ai 知道的那些内容,很容易走到「遇事不决,可问AI」的境地。
这个过程早期过于诱人 ,立马就能感受知识在你面前喷涌而来的那种爽感。很容易就沉溺于这种不断对话追问答案的状态,无法自拔。
但是,但是,长期来看,这种有事就问 ai 会导致一个问题:
人,会,忘,掉,如,何,思,考!
我自己的使用体验,有好多次不经意间就滑到了那个空间领域。费了很大功夫,一直在对抗它的吸引力。
千万要警惕它,它是工具,你一定要比工具凶!
视频批量分割工具
用 Bolt 写了一下,直接上线了,有类似需求的可以试试。
输入剪辑时间节点后会生成 FFmpeg 命令。
Bolt 才是小白的神器啊,编写、Debug、部署一条龙。
有需求的话我写个文章体系化介绍一下整个 AI 短片分析工作流。
这里尝试:https://gentle-otter-c63b0f.netlify.app/
🤨 神级 Prompt 其实没那么神(刚好算是个合适的话题,蹭蹭热度哈哈)
早上看到卡兹克写的《17 岁高中生写了个神级 Prompt》,说是 claude 用了后,甚至能像素级复刻 Flappy Bird(视觉效果简直无敌),心想还能这样?
——————
💬 我也对比测试了,先说结论:
1. 不少人觉得“神”,其实是 Claude 3.5 sonnet new 神。全球顶级大模型,你不用这段 Prompt 依然也可以生成神级回复
2. 我没法用“神” prompt 复刻出像素级高仿的 flappy bird,神 Prompt 吹的有点过了
👉 你可以再想想,用了以后感觉生成质量好了,到底是:
1. 你对生成结果本身没有预期,对此本身就不了解,只是玩玩而已?
2. 你没用过几次 claude 3.5 sonnet new ,所以不知道裸 claude 本身就已经这么强了?
❓要不,选些你所专业的领域任务,先想好你要什么结果,再试试呢?
🔬以下是我的测试结果:
P1 是文中的宣传效果,P2 是我神 Prompt 实际测试效果,P3 是不用神 Prompt 的直接提示效果
事实证明,不需要额外提示词,Claude 已经足以完美实现游戏机制的复刻。但对复杂视觉元素的设计,不是一段提示词能解决的。
文章应该是进行了选择性宣传。实际想实现这个效果,大概率是需要单独把设计资源链接告诉 AI,让它进行引用的。
——————
不过,对于普通用户来说,如果把这个 prompt 预置在 chatbot 中,确实能在简单场景中是可以用更少的 input ,获得更“好”更长的输出,主要适合:
1. 在用户不熟悉的领域给予思考启发
2. 帮助用户做一些没那么高标准要求的事情
不过说实话,这种场景下,你让 AI “针对 xx,再 step by step 反思优化一下”,也能满足预期了
——————
鼓励大模型进行 CoT 思考确实能获得不一样的输出效果,这是一个很实用的技巧。但目前不存在能够让大模型成为全能专家的通用型 CoT 提示。
如果说,“我觉得这 Prompt 真是神了”,大概率是因为用户本身也不熟悉该任务领域,对生成的结果没有自己的高预期标准。
Gemini 拉片流程终于完整了!!
用 Claude 写了一个小工具输入对应的时间节点,可以一次性将所有分镜直接剪辑出来。
整个流程会由 Gemin 生成的分镜拆解(画面内容、台词、翻译、隐喻)搭配对应分镜的时间戳、Claude 剪辑命令生成工具组成。
今天卡兹克发的帝帝那个可以让 Claude 获得类似 O1 思维链的提示词太强了。
再一次证明了随着模型能力的提高,提示工程的重要性也会越来越高。
绝对不是模型越厉害提升工程越不重要。
我用这个提示词思考 AI 生成视频模型和传统图形科学的异同,它得出了和 Runway CEO 类似的结论。
另外不建议折叠 Claude 的思考过程,他的思考路径和方向往往比结论更有价值
OpenAI o1做到了LLM在线推理的scale-up,其实这样的inference-time scale-up也是机器人领域新趋势。
⭐️我们暑假开始做的工作👉DIAL-MPC这套基于扩散模型(Diffusion Models)的方法也实现了机器人在线推理的scale-up (之前的强化学习可以说都是在做离线的scale-up)
很高兴我们的工作受到了很多顶尖实验室(CMU,斯坦福,CalTech)和硅谷机器人公司(DeepMind, NVIDIA)的广泛关注和初步应用
秉承Build in Public,分享下使用Cursor实战开发一个前后端分离的网站的经验,希望对大家有帮助,有问题评论区留言,我看到会回复
✅1.明确技术栈
Cursor中模型我选的是cluade 3.5 sonnet,openai用过就知道根本没法比。拿到一个需求,首先让claude推荐能实现这个需求的技术栈,然后在cursor setting全局配置中的Rules(图1)和项目根目录的.cursorrules中包含对应的技术栈,这个网页中有很多cursorrule的模版,我就是在里面找的https://cursor.directory/
✅2.设计架构,逐一实现(图2)
就和写作文一样,你要先写一个大纲,然后根据大纲填入对应的内容
千万别上来就和cursor说我要你帮我实现一个文生图网站,人工智能不是神。
你就是架构师,cursor就是程序员,我通常会这样对cursor说:“好的,让我们一起来实现这个需求。你先把整体的架构列给我,先不要写代码”
然后cursor列出架构后,你根据自己的需要,增加或者减少
✅3.遇到报错保持耐心,运用好command+回车(macOS, windows我不知道是什么)
command+回车在cursor里面是可以让cursor阅读你当前项目的全部文件。像我这次项目代码特别多,光api的文件就7个还是8个。(图3)
我举个例子,比如有生成图片api,生成音频api,提取pdf文件api,如果你添加了某个功能代码开始报错或者进行本地调试怎么都运行不了,你可以这样子和cursor说:”现在我们遇到了一个报错,控制台日志如下:xxxx,你先不要急着写代码,先分析下可能是哪些文件中的代码出了问题,告诉我需要提供代码的文件,你再修改”
✅4.如果遇到要修改现有文件的代码,一定一定要给cursor这个提示:“先阅读一遍我目前的代码,再进行修改”,你不这样说,cursor可能不知道你目前代码的结构,把你关键功能直接改没了都可能
✅5.前端页面如何快速实现?
你可以选择上v0.dev或者别的文生图,生成一个界面的图片,再发给claude让你复刻。我对界面没什么要求,我就是这样提示cursor的:“我们的网站主题是ai播客生成,我希望整体的设计风格是充满活力和激情的,请你以此基础发挥想象力设计我的ui界面。
我的第一个产品:Ai播客生成器现在上线了!
地址 https://mypodmates.com/
这是一个你可以放入PDF或网页,自动生成双人对话的播客。你会看到有两个ai机器人在对你输入的内容进行聊天和讨论
✅核心内容:
1.PDF分析:目前最高支持上传15-20页,5M以内的文件
2.网页分析:上传网页链接,分析网页内容
3.问题导向:可以输入你想重点聊的话题,比如放入一篇关于苹果简介的pdf文档,想重点关注苹果的生产地有哪些,播客内容会重点围绕这部分
❌待提升:
1.目前只支持英文,多语言(包括中文)未来可能放入,主要看用户反馈,不知道中文需求多不多
2.语音生成能力待提高:现在已经找到了更好的语音生成模型和解决方案,打算先收集一下用户反馈
3.PDF更长的文件支持
由于成本问题,我自己也是今年刚毕业,没什么储蓄,所以目前新用户免费赠送2次生成音频的额度,如果有更多的使用需求欢迎付费。关于产品的任何反馈或者疑问也欢迎向我提出
最后感谢:
GitHub开源库:https://github.com/meta-llama/llama-recipes
感谢豆哥的社群技术支持@艾逗笔
感谢飞哥的社群seo支持@哥飞
还有感谢一些路上为我排忧解难的朋友,太多了就不一一艾特了。
10$7fus3rRwgLA$/
假两件【连帽棉服!】男女情侣同款连帽棉袄,领500元专属优惠券。
原价【599元】,券后👉【99元】!
王炸组合!硬核爆品!超级羽绒棉服+卫衣组合来了,专柜价五百多!我们破价冲量商场同款一件500多!太炸了吧从容应多变气候,两件件N种穿搭变化!全天候全场景可穿!高级货白菜价,快锁库存,男女同款!冲!!手慢无!
点击直达⬇️
https://s.click.taobao.com/SKeQ1Gt
👇
自助领券: ok.gocodehub.com
支持淘宝/京东/拼多多/唯品会等平台的渠道券
自购领券,省钱多多,不领必亏
我回来了~
因为一连贯的原因,在去年11月脱离了AI这股浪潮
甚至为了节约精力,主动切割了和这个行业的联系
期间的忙碌和疲惫尚可切磋,但时不我与的感觉可真不好受
沉舟侧畔千帆过,不是沉舟竟过千帆,而是千帆已过,你却陷于沉舟
好在还有病树床头万木春的下半场,还能有杯酒长精神的意气
重新入学,重新开始,马丁3.0
顺便,谁能告诉我,最近一年,AI最大的进展是啥?
除了字节杀入了几乎所有领域以外(这一年里最放不下我的就是字节的猎头了)
过去一年半做了多个AI项目,有简单有复杂的,有面向超大规模的小白用户,也有面向垂类人群,其中prompt是非常核心的要素,也是大家在做项目时绕不开的逻辑。在此总结了做prompt方案设计的经验和教训
核心结论:
GenAI带来应用新范式,支持通过prompt生成优质的个性化结果,但大众用户不想打开键盘,也不知道填什么prompt,所以需要在保证最终效果的前提下,尽可能通过低成本的表达方式来获得用户的意图。
对话式交互是未来,但目前还无法取代传统图形化交互。
1. 交互:不要让prompt变成操作阻力
- 非必要,勿填prompt,让用户多填一个字,都是对用户规模和转化率的巨大折损;
- 如果有prompt的效果更好,那么把prompt做成选填,让专业用户有选择,又不影响小白用户的使用路径;或者首次不填,快速预览结果,后续深度使用再填
- 如果必须填,尽可能填用户不需要额外思考的,否则用户一思考,数据就掉
- 通过推荐词降低输入门槛,并保证对prompt的响应,避免拔高用户预期后但结果又不符预期
2. 信息:通过算法、或信息授权方式来获取用户意图和context背景信息,而不一定要手动输入
3. 流程:把prompt填写留在最后一步,让用户先完成简单的熟悉的操作,增加沉没成本
4. 生态:少数偏专业用户的prompt,沉淀在端内成为模板流转,服务更广大小白用户一键套用和二创。对工具产品来说,飞轮逻辑可能比漏斗逻辑更重要,因为效果比效率更重要。要站在整个平台,整个大生态去思考,从更长周期看对用户的价值,对平台的增长和商业化的价值
提示:
- 我是在一个已有的大体量的移动互联网产品中融入AI能力,用户的习惯、预期,以及业务指标护栏都会对新方案的设计做限制
- 以上交互案例是表象,数据也是表象,仅供参考,不一定能复用到其他产品
- 最重要的是,你的用户是谁,他们的需求是什么,你的产品当前处于什么领域、什么阶段,如何更好的满足他们的需求
“我认为大家不要把具身智能和人形机器人划等号,人形机器人不一定就是目前最好的商业模式,这样会把技术门槛划得过高。而且现在来看,最成功的机器人是扫地机器人”
“为什么要人形呢?”
——唐沐
Windsurf Editor 一个新的 AI IDE
没有等待列表,没有包月套餐、全免费用 Claude 3.5。
这个 IDE 对小白非常友好!!
你可以用类似 Bolt 的方式一句话开始一个项目。
右侧聊天框会帮助你安装依赖输入命令启动项目。
如果你也觉得 Cursor 太复杂不会用的话强烈推荐试试 Windsurf。
269元包邮秒杀!
👉紫色回货了!骆驼山海夹克冲锋衣/
👉2🛒fu致(DfJB3rDCJwi):// CZ3457🍑寶:/
--------------------
有大水!速度!随时无!
骆驼旗舰店•山海夹克冲锋衣
269亓
4级防水防风,一件顶6件!闭眼冲!
颜值和实力并存,拍照嘎嘎有氛围!
4级防水防风,一件顶6件!闭眼冲!
颜值和实力并存,拍照嘎嘎有氛围!
--------------------
下单地址:https://08wcztp.kuaizhan.com/?_s=VkEvQ4
Sam Altman发了条言简意赅的推文:there is no wall。
终于还是被推出来回应大模型预训练陷入瓶颈的行业恐慌了。
清理了一下时间线,大致上是这样的:
- The Information率先报道,OpenAI因为GPT系列模型的进化速度放缓,调整了公司战略,GPT-5难产已成定局;
- Bloomberg随后助攻,把采写范围扩大到了OpenAI、Googe和Anthropic三家公司,发现新版模型全在推迟发布,可以看到收益递减曲线;
- AI社区此时普遍还认为媒体报道有失公允,觉得没有核心从业者出来证言,只是搜集了边角料想搞个大新闻而已,大家不要慌,「且听龙吟」;
- 然后从OpenAI出局的前首席科学家Ilya Sutskever刚好跳出来补刀,对路透社判断大模型扩展法则确实已经到达了极限,必须改变训练模式;
- Meta的首席科学家、图灵奖得主Ynn LeCun也没放过攻击闭源竞争对手的机会,在Threads上表示「我不想说我早就告诉过你,但我确实早就告诉过你」;
- Anthropic的创始人Dario Amodei在播客里安抚市场,认为预训练的扩展法则(Scaling Laws)来自经验而非客观规律,但自己会押它仍然会继续存在;
- 再就是两个小时前,Sam Altman现身喊话,说物理学不存,不对,是墙不存在。
Runway CEO 是这波 AI 视频所有公司中想的最清楚的一个。
其他产品都是模型是模型产品是产品,像是出现 bug 的机器人,左脚画圆右脚踢。
短时间的领先与否并没有那么重要,核心是不下牌桌,现阶段的所有(产品功能、用户、数据、模型)都是下一阶段的基石。
重要的是能否预测到下一阶段的风浪并在这个阶段完成准备。
回到他昨晚发的内容本身。
现代图形学是先解决了控制问题再解决的渲染质量问题。
AI 发展则反其道而行之,先端到端的解决了渲染质量问题,我们面前的是控制问题。
正如计算机图形学最终解决了渲染问题,AI 也一定能解决控制问题。
核心不是是否可以解决,而是我们准备如何解决。
AI 生成内容是否能够提供与传统计算机图形学同等水平的可预测性和精确性,这正是 AI 生成内容能否成为创意表达基础工具的关键所在。
我们的目标是实现实时、低成本,并且具备尽可能直观和通用的精确控制能力。
这一次,控制能力虽然最后才能实现,但它终将到来。
宠物狗会不会就是人类的未来。
只要有人养,就衣食无忧了。
只是代价是,放弃繁殖。
人类现在正有一批 LGBT 在提前布局。只等 AI 机器人崛起后,去领养他们了。
可能所有选择都是对的。
首页组件我要求包括但不限于:1.Hero 2.cta 3.faq 4.how it works....”
✅6.最重要的一点,你和cursor对话的时候通常会开多个聊天框(看图4右侧滑动按钮我完成这个项目开了多少聊天框),一个聊天框聊的东西多了就特别容易抽风,怎么保持让cursor的记忆同步呢?
每聊完一个聊天框,你要开启新聊天框的时候,就和cursor说:“请你回顾我们前面全部对话,总结更新我的项目架构文件,供未来别的开发人员使用“
✅7.总结:
cursor很强大,也很弱,取决于你会不会使用。
我前端是用next.js,后端用python,中间还涉及一些我从来没有接触过的服务器,命令行等运行命令。你一定要把前提和背景告诉cursor,举个简单的例子,我要在hugging face space上部署项目,但是发现服务器启动的时候日志疯狂报错,你千万不要直接把报错日志丢给cursor,这样子解决不了问题,你要这样说:“这是我部署到hugging face space服务器的时候的错误日志,请你看一遍,然后你告诉我可能是哪里出了问题,需要我提供哪些代码文件给你,我嗯先不急着写代码,先一起讨论下”
希望对大家有帮助,以后还会继续分享我在实战中使用cursor的经验。我是完全0代码基础,我可以,你一样可以,不要对未知的技术畏惧,不懂的就耐心去问cursor
Bolt New 的产品和销售数据出来了!
- 4周时间,从0到400万美金的 ARR!
- 使用的 Claude API 消耗量每天翻倍式增长
- 每周有十万人持续使用
这种爆发式的增长,核心是因为它解决了一个一直以来的行业难题:
Web 是世界上使用最广泛的平台,但开发者却无法在浏览器中构建 Web 应用。
通过开创性的 WebContainers 技术和先进的 AI Coder 解决了这个问题。
Bolt 认为未来人人都是开发者,十亿级别的开发者!
一个现实的例子是,一位用户在 Upwork 上获得了 5000 美元的报价和 2-3 个月的时间来打造她的 MVP。几天后 Bolt 发布,她购买了 50 美元/月的计划,并在不到 2 周的时间内构建并推出了她的产品。
引用链接:https://www.anthropic.com/customers/stackblitz
字节的通用图像编辑模型 SeedEdit 发布了。之所以说是编辑模型,因为可以基于刚刚生成的图片改图,包括修图、换装、美化、转化风格、在指定区域添加删除元素等各类编辑操作。
跟普通的编辑最大的区别是自然语言交流。我试用了一下,相当顺畅。自然语言驱动的编辑在业内还是少见的,尤其考虑到豆包本就是目前最有影响力的 AI 通用产品之一,这次可能会真的影响很多人设计的方式。
我之前用 Midjourney,跟很多朋友一样,急迫需要连贯性一致性的绘制形式,可以满足长篇的连贯的设计表达,比如做出有同个主人公的漫画、同类海报的不同呈现等等。
在豆包的官网 doubao.com 能体验到,大家可以试试看。
刚刚国内的一个做网文的客户看了下效果,表示满意。
然后,他们公司把这个程序买下来了……
有点夸张,但是真的……
感谢AI赏饭吃,本周加鸡腿。
把我整理出来的prompt分享给大家吧:
视角:视角为上帝视角,读者知道每个人物的行为动机,和心里活动。
读者群体:15到25岁的少女或者女性群体,晋江网站的读者
文风:幽默风趣,俏皮,充满着女性的可爱和柔美
段落风格:多换行,少用长句子,多用对话推进情节,避免过多的解释
情节:可以按照你的理解增加新的故事情节,如果你觉得当前的情节不足以支撑过多的字数情节,你可以按照你的理解来丰富内容,甚至创造新的支线剧情
避免重复:不仅避免相同的句子、情节、对话、场景描述和情感表达,还要确保任何重复的信息都能有所不同地呈现,以增加故事层次感,减少冗余感。
剧情快速推进:在每一章或每一个重要场景中,确保有推动情节发展的事件或决策。减少缓慢的内心独白或背景介绍,通过角色的行动和对话来展示故事关键要素。
连贯无断层:每个情节的承接点应自然流畅,从一个场景进入下一个场景时,合理描述事件或情绪的变化,避免突然的情节转折让读者感到突兀。
起承转合清晰:在每个段落或章节中,设置小的高潮和转折,并为主要情节做好铺垫,使读者能够循序渐进地融入情节发展。
无意义的对话和场景减少:确保每一句对话、每一个场景都具有明确的情节功能(推动情节或展现角色性格)。无实质内容的对话避免出现,每一场景的描写都应紧扣情节或人物发展。
多换行、少用长句:增加视觉上的“喘息”空间,使用短句增强节奏感。在描述情绪时用简练的词汇,不冗长,保证阅读时顺畅。
语言流畅自然:选用简洁明了的现代用词,减少过多修饰,避免用过于冗杂或华丽的语言,特别是在紧张的情节或情绪描写中。
情感和情绪的准确表达:用更直接、精准的方式表达人物情绪,避免含糊或过于抽象的情感表述。情感逐步递进,增加人物情感的张力。
视觉与情境感的渲染:在环境描写中,用简洁而富有画面的文字,将场景“画”出来,使读者更容易融入。
阿里开源了 Qwen2.5-Coder-32B 代码模型。
代码能力超过了 4o,接近 Claude 3.5
整个系列还有 0.5B / 1.5B / 3B / 7B / 14B 几个规格。
另外提供了常见格式的量化模型。
还有一个类似 Claude Artifacts 的工具被开源,可以去玩玩。
详细信息:https://qwenlm.github.io/blog/qwen2.5-coder-family/