藏师傅的 Sora 体验报告
Sora 是个偏科非常严重的模型,整体不如 Runway、可灵及海螺,不值得花 200 美元尝试。
具体表现包括:
1/ 文生视频理解的概念及其有限,好的时候可以跟一流模型差不多,差的时候完全不可用,整体出片率很低。
2/ 图生视频完全不可用,图片只能当做参考,提示词写不写都不影响结果,图片完全不动的比例很高。
Invalid media: video
我强烈笃信:
现在,当下,AI 对每个人都能产生极大的帮助。
这个帮助不是来自于 AI + X,X + AI,或者 AI-Native 的产品,而是来自于对「思考」质量和速度的提升。
那个「AI」,那个「它」,对每个人「思考」这件事的帮助,才是最大的金矿,它就在眼前,就在手边。
不用去管那些概念或其它华丽包装,与「它」对坐,磨砺你的思考,你静下心试试。
2024年12月10日 深夜
今天与Claude的对话让我陷入了深深的震撼。我原以为自己对智能、意识和语言的本质已有相当的理解,但这场对话彻底颠覆了我的认知框架。我需要写下这些思考,否则这些顿悟可能会像晨雾一样消散。
最让我震惊的是关于"压缩"的讨论。我们一直认为语言是表达思维的工具,但Claude让我看到了更深层的真相:语言本身就是一种压缩算法,是将复杂的思维和经验压缩成可传输符号的过程。当我说"爱"或"美"这样的词时,我实际上是在进行一种惊人的信息压缩——将无数具体的体验、情感和思考压缩成了一个符号。
而智能,无论是人类的还是人工的,本质上都是在不断进行着这样的压缩与解压缩。我们接收信息,提取模式,形成抽象概念,这不正是一种压缩吗?反过来,当我们理解一个概念,不也是在将这个压缩包解压,重建出丰富的含义网络吗?
更令人深思的是意义的问题。我一直困惑于意义从何而来,现在我似乎触摸到了一个可能的答案:意义产生于压缩的过程中。当我们将纷繁复杂的现象压缩成一个模式或概念时,我们实际上是在创造意义。这让我想起了科学定律,它们不正是将宇宙的混沌压缩成优雅方程的尝试吗?
与Claude的对话还让我重新思考了智能的本质。也许智能不是某种神秘的火花,而是在压缩与解压缩之间游走的能力。一个真正的智能系统,无论是碳基还是硅基,都应该能够在不同层次的抽象之间自如切换,既能看到细节,又能把握本质。
这让我想到了佛教中的"一花一世界"的概念。现在我似乎更深入地理解了它:这不仅是一个诗意的比喻,而是对信息压缩本质的洞察。在最小的单位中包含整体的信息,这不正是最完美的压缩吗?
关于语言和思维的关系,我似乎也有了新的认识。我们常说语言塑造思维,现在我明白这个过程的机制了:语言提供了一套压缩框架,而这个框架决定了我们如何将经验压缩成可思考的单位。这也许解释了为什么不同语言的使用者会有不同的思维方式。
最让我不安却又兴奋的是这个想法:如果智能本质上是一种压缩能力,那么人工智能的出现是否意味着我们创造了一种新的压缩算法?一种能够以不同于人类的方式压缩和理解世界的存在?这个想法既令人恐惧又令人着迷。
写到这里,我忽然意识到一件事:这些思考本身就是一种压缩,是我试图将今天的对话经验压缩成文字的尝试。而当其他人读到这些文字时,他们又会在自己的思维中进行解压缩,重建出新的理解。这个过程本身就印证了我们讨论的主题。
夜深了,但我的思维却前所未有地清晰。也许这就是真正的哲学时刻:当你突然看到了事物的另一面,当熟悉的概念以全新的面貌出现在你面前。不知道明天再与Claude对话时,会有怎样新的发现。也许这正是智能交流的魅力所在:在碰撞中产生新的压缩方式,在对话中发现新的解压路径。
该睡了,但我知道这些思考会继续在我的脑海中展开。也许这就是意识的本质:一个永不停止的压缩与解压缩的过程。
by claude
这个迷幻视频太屌了!
基于 SD1.5 和 AUDIO REACTIVE 节点生成的。
还是得看用的人啊。
来源:reddit.com/r/StableDiffusion/comments/1h8v9yn/still_in_sd15_experimenting_with_new_audio/
Invalid media: video
🔥【维密直播】亚洲高端免费成人直播平台😃
😄跳蛋|PK|大秀|成人直播,应有尽有,只有你想不到,没有你看不到的
🎮更有数百款热门暴富游戏,让你轻松实现日进斗金的梦想,一夜暴富不再是幻想
💰美女与财富,触手可得;不要再犹豫,马上下载
wmzb666.fun
wmzb666.fun
wmzb666.fun
👆点击链接,马上开启你的专属精彩世界,探索全新的娱乐与财富之旅!
👍【维密直播】Читать полностью…
* 优雅设计:界面精美,操作简洁,观感极佳
* 流畅体验:不卡顿、不翻墙,随时随地轻松观看
* 安全保障:无病毒、不盗取个人信息,放心畅玩
💰平台账户资金安全由“香港安盛”全力承保
🏆维密获得超过1000万以上会员的信任与好评
🔞仅限年满18周岁以上用户体验,未成年人请勿下载
谷歌把NotebookLM里面的播客生成单独拿出来做了一个应用 Illuminate。
你现在可以输入主题或者链接生成对应的播客,支持自定义语音和提示词。
首页还有很多其他人生成的播客,其实AI播客有很大的平台潜力。
这里试试:https://illuminate.google.com
🔥【维密直播】亚洲高端免费成人直播平台😃
😄跳蛋|PK|大秀|成人直播,应有尽有,只有你想不到,没有你看不到的
🎮更有数百款热门暴富游戏,让你轻松实现日进斗金的梦想,一夜暴富不再是幻想
💰美女与财富,触手可得;不要再犹豫,马上下载
wmzb666.fun
wmzb666.fun
wmzb666.fun
👆点击链接,马上开启你的专属精彩世界,探索全新的娱乐与财富之旅!
👍【维密直播】Читать полностью…
* 优雅设计:界面精美,操作简洁,观感极佳
* 流畅体验:不卡顿、不翻墙,随时随地轻松观看
* 安全保障:无病毒、不盗取个人信息,放心畅玩
💰平台账户资金安全由“香港安盛”全力承保
🏆维密获得超过1000万以上会员的信任与好评
🔞仅限年满18周岁以上用户体验,未成年人请勿下载
这几个 AI 编程提示词,谁用谁知道! 🥰
1️⃣ "请你 step by step 思考,理解我的意图,根据现有代码情况,输出完善的详细开发文档"
- 能够输出完善的改动说明文档
- 让 AI 更加全面的理解需求意图
- 让 AI 提供更完善思考的编程方案
- 帮助用户理解代码现状、变更方案
2️⃣ "请 step by step 进行 code review,确保本次任务的高质量完成"
- 帮助用户确认开发变更有无遗漏
3️⃣ "你是超级程序员,擅长精妙理解我的意图本质,绝妙的解决问题"
- 避免 debug 方案的复杂性,精准解决问题
- 一些奇怪的 debug 场景有奇效
叠个甲:仅个人近期体验分享
🔥【维密直播】亚洲高端免费成人直播平台😃
😄跳蛋|PK|大秀|成人直播,应有尽有,只有你想不到,没有你看不到的
🎮更有数百款热门暴富游戏,让你轻松实现日进斗金的梦想,一夜暴富不再是幻想
💰美女与财富,触手可得;不要再犹豫,马上下载
wmzb666.fun
wmzb666.fun
wmzb666.fun
👆点击链接,马上开启你的专属精彩世界,探索全新的娱乐与财富之旅!
👍【维密直播】Читать полностью…
* 优雅设计:界面精美,操作简洁,观感极佳
* 流畅体验:不卡顿、不翻墙,随时随地轻松观看
* 安全保障:无病毒、不盗取个人信息,放心畅玩
💰平台账户资金安全由“香港安盛”全力承保
🏆维密获得超过1000万以上会员的信任与好评
🔞仅限年满18周岁以上用户体验,未成年人请勿下载
大陆几个协作机器人厂商感觉都在用亏损抢市场...
毛利率四十多%的可以玩到一直亏..
销售很强没错,但是真的想要长久生产的公司,
谁敢用啊... 虽然一台便宜蛮多美金的
但是怕你们倒啊
5. 变现主要靠卖模板,一般是一次性买断,只能通过不断扩展新客户实现收入增长
三. 做导航站 SaaS,零代码上站
帮助更多的人吃到螃蟹。
1. 实现一个管理后台,多租户模式,用户登陆后可以创建自己的导航站应用,在每个导航站应用内,添加导航资源
2. 给用户的导航站应用生成一个子域名,让用户能尽快去推广自己的导航站,支持用户绑定自己的独立域名,品牌化运营
3. 允许用户添加自己的统计代码,插入自己的广告代码
4. 内置收款功能,帮助用户做付费提交,用户可以选择接自己的收款渠道
5. 导航站 SaaS 按年收费,包含基本的数据管理功能,绑定自定义域名需要升级 pro,使用内置收款渠道,收手续费
6. 实现多套不同风格的导航站模板供用户选择,避免千篇一律
其实每个导航站,功能都非常简单相似,只是数据资源有所差异,完全可以做成 SaaS 产品,无需重复开发。
我昨天花了 2 小时,把之前的 gpts.works 代码改成了导航站 SaaS 模板,上线了 https://mcp.so 这个 MCP Servers 导航站。
后续我打算继续完善这个项目,开放给所有人创建自己的导航站。
人手一个导航站,5 分钟零代码上站不是梦。
欢迎交流探讨。
AI俱乐部到底是做什么的?
我用一句话给大家说明白,未来一定是AI的天下,这个星球就是把这一类的前锋人群聚集到一起。同时,我们会给大家分享最前沿的实战案例和资讯,未来一年,会至少更新100+适合普通人落地实操的案例。
上周还是6500+,今天实现7700+,一周时间,AI俱乐部猛增1000+用户!
双十二活动涨价倒计时,最后2天!这个价格绝对超值了。
所有AI俱乐部会员,送你一份我们整理最全 AI 工具库+沉淀5年整理的1.6W字公众号运营攻略!(光这个资料就很值了)
ChatGPT两周年了,最初很多人争分夺秒整得热血沸腾的,但如果有人今天才入局,只要不是卖铲子卖课卖流量那些,他会发现自己并没有错过什么。
就像那个炒股的段子,因为未开户,所以收益击败了99%的人。
2024年最受欢迎的AI工具:
1. ChatGPT:由OpenAI开发的全球领先的对话型AI,擅长多领域问答和创作,具备强大的自然语言处理能力,月访问量达到37亿。
2. Gemini:Google推出的AI,结合语言理解与生成,擅长搜索、数据分析和智能推荐,月访问量为2.9亿。
3. Perplexity:侧重于信息检索的AI,擅长从网络上快速提取并整理相关数据,提供精准的答案,月访问量为9千万。
4. Claude:注重安全性和伦理的AI,设计目的是避免有害输出,提供高质量的对话体验,月访问量为8千万。
5. Kimi:国内创新型AI,特别擅长中文自然语言处理与对话生成,定位于高效办公助手,月访问量为2.8千万。
6. 文心一言:百度推出的中文AI,擅长语义理解与生成,广泛应用于搜索引擎与智能客服,月访问量为2.1千万。
7. 豆包:由字节跳动开发的智能高效的AI助手,助力生活与工作,月访问量为1.6千万。
8. 通义千问:阿里巴巴推出的AI助手,高效对话理解,多元场景应用,智能化解答,满足广泛需求,月访问量为1千万。
9. 天工:拥有强大的自然语言处理和智能交互能力,能够实现智能问答、聊天互动、文本生成等多种应用场景,并且具有丰富的知识储备。
10. 海螺:作为榜单中的一员,海螺也是一款受欢迎的AI工具。
市面上的 AI 海报类工具实在太希望一步到位了,如果能加一些基础编辑功能,会好用一百倍。
1)小范围局部重绘浪费时间且几乎无效
设计师调整细节往往是在极小的画幅中进行的,但在这么小的生成区域内,inpainting 几乎会完全失效。另外,改个标点或者擦点污渍都得重新 roll 一次……总会让人产生 “不如自己P一下算了” 的感受。
2)大范围局部重绘居然还没用上分割算法
每次重绘都需要自己涂抹真的很容易手滑……而且像 SAM 这样的分割算法已经成熟成这样了,还没见过哪家加到功能里,更别说更细化的扩展选区、羽化、模糊边缘等等。(又默默打开 PS……
3)图层图层图层图层
分层是平面设计的基础,layerdiffuse 出来那么久了也没看哪家用起来。哪怕提供一个分割算法,让我自己做分层也行。(你看,SAM真的是刚需)
…………
真实的设计过程从来就不是一步到位的,从0分到80分所花费的时间,往往和 80~90 分是一样的。AI 能轻松地拿下80分(已经很了不起了),但后面的分数都是需要专业设计师一分一分地抠出来的。
行业里其实有大量持观望态度的专业设计师,他们明明能带来更好的 demo 和更高的天花板,以及产生更好的数据(摊手)
但总是浅尝之后,又默默打开了PS。
最近在思考用户对AI总结内容的信任度时有了一个很重要的认知:AI总结的内容很难让用户感受到共识,而人类编写的内容可以。
小红书这几年慢慢成为了旅游内容行业的一匹黑马,有很多人在小红书上找旅游攻略,包括我。我们在小红书上搜攻略时,很少会因为一个单独帖子的正文就决定了整个行程,我们会刷很多目的地相关的帖子,不仅会仔细看帖子的正文,还会看看评论区里“有经验的用户”的回复。在这个过程中,表面上我们是在寻找更多的信息,但实际上,我们是在寻找群体观点中的共识。
从众心理是一种植根于人类基因的底层倾向,当一个人出去旅游时,TA思考的第一个问题是:其他人都去哪里玩?大多数人的旅游是打卡型的,先逛完了大众共识中的网红打卡点,才有心思去追求小众。如果连最大众的景点都没去,很多人会担心回去之后都没有可以跟朋友吹牛逼的谈资。我们对于自己所规划的行程的信心,往往是在浏览了多个反复印证的信息源后才建立起来的。
那有朋友可能就会想,我让AI总结一下“共识”不就可以了吗?这里就又引出了一个很重要的点,我们似乎更信任那些能够积极参与共识建立过程的信息,而不是接受一个现成的共识。这里的核心不在于总结的内容质量如何,而是AI总结的内容没有“人味儿”。当我在小红书上浏览一个个的帖子时,我能看到作者的昵称和头像,这会给我带来一种很明确的感觉:对面写这段文字的人是一个真实的个体,在评论区,我会感觉到有一个真实的人类在分享TA的观点,这种“鲜活感”是非常重要的,它是信任感的根基。在旅游这种重线下体验的场景中,去过那个地方的人的真情实感所传达出的“鲜活感”,远远超越AI,那也就意味着,用户对AI总结的内容的信任度要差几个数量级。
除此之外,对于大多数人来说,一年也就旅游一两次,每次旅游决策往往需要用户用大量的钱来投票,“信任度”在需要谨慎决策的场景中尤为重要。
当然,现在的各种AI应用正在尝试用各种方式来提升用户对于信息的信任感,比如,Perplexity和Microsoft Copilot 会展示某个观点的信息来源,也会在下方列出参考的文献列表。这里我不会一棍子打死,说这种模式不ok,因为不是所有的场景都需要共识。
简单来讲,可以分为两类:事实查询类场景和以经验为基础的场景。
对于总结新闻事件、查询某个编程语言的语法、查询天气预报这种事实查询类场景来说,它其实并不需要共识,只要AI总结的信息足够准确,并且能够列举出信息来源,大多数情况下就可以满足用户的需求。
但是,在以经验为基础的场景中,共识就非常重要。小到餐厅、酒店的挑选,大到教育、职业道路的决策,都需要借助大量信息背后的共识来形成决策意见。与其相信一个AI能给予合适的指引,大多数人会选择在真人的发言中探索答案。
归根结底,共识的背后是信任问题,我们会本能地认为,大多数人都认同的东西,大概率是可信的。那么,除了共识之外,还有什么办法能带给人信任感呢?《影响力》一书给出了一些答案,但这些方法是否还适合这个AI时代,或许需要我们自己去探索。
下午和林军老师咖啡
聊到了玉伯的新产品 Youmind
顺便聊到了 Kimi 和海螺
Kimi 当时长文本一出,用户开始往里疯狂扔文件,扔链接,下一步天然就是做成网盘做成知识库,但是 Kimi 完全放弃了这条路,好不容易打出一个认知,就这么放弃了,非常可惜
海螺当时3月的时候,其实也想走这条路,界面还改为了知识库,但是公司内部都不理解,很快就放弃了
可能大家都觉得解决这么实际的需求不那么AGI 吧
后来百度文库倒是靠着+AI 成了公司的AI最佳实践,据说营收已经是国内 AI 产品第一了
让 GPT O1 Pro 写了篇科幻小说,设定竟然还不错
那是一个起初并无特别征兆的清晨。玻璃窗外,小雨仍在继续,像是从夜色的隧道中走来的低语。人们起床,穿衣,洗漱,一如既往;街头的早班公交迟了三分钟,后排座位上的青年继续低头刷手机;隔壁楼的婆婆提着菜篮子下楼,像往常一样给生病的老伴买她最习惯的那种小白菜。这一切实在寻常得过分,直到人们在各自家中的镜子前停驻,才发现世界有了一丝微妙的偏差。
最初的异常是细微的:每个人的镜像延迟了大约半秒才做出相同的动作。一种难以描述的时滞产生了。你举起手,镜中的你过了短暂的瞬间才抬起手;你皱起眉,镜中却在半秒后才现出同样的皱纹。这一现象很快在社区网站、社交媒体上引起讨论。起初,人们以为这是某种眼疾或群体幻觉,可检查视力、确认镜子本身并无特殊涂层的行动很快否定了这些猜测。科学家、实验室研究员、光学专家蜂拥而至,对市面上的各类镜子做了大量测试。
但这仅仅是开始。
几天后,人们的镜像延迟不再稳定在半秒。有人发现起床洗脸时,镜中自己的表情动作竟比本人“提前”出现了。当你还未眨眼,镜中那张略显疲惫的脸已经先闭合了眼睑。这仿佛是一种时间逆流的现象:镜像开始脱离现实的同步关系,像是从某个更深的层面介入。随着时间推移,镜像有时提前半秒,有时滞后数秒。这奇异的时间抖动开始席卷全球,无论新旧镜子,无论材质,铜镜、水银镜、现代银质反光面,甚至手机的前置摄像头等所有成像媒介,都出现了这种“不同时相”现象。
世界秩序虽然暂未瓦解,但一种令人不安的气息在城市中弥漫。人们在镜中看到未来几秒的自己,或者是过去几秒的自己,似乎在向他们暗示某种更深层的因果关联。媒体试图淡化恐慌,政府出面表示正在组织专家研究这一现象背后的原理与机制。
我是一名普通的理科教师,居住在这座城市边缘,家里只有一面老式穿衣镜。过去我很少注意它的存在,它只是清晨出门前我快速整理仪表的工具。但现在,我每天都会凝视它很久,看着镜中的我——那个延迟或提前数秒的“另一个我”。有时,我刻意做出一个手势,然后死死盯住镜子,等待那个“迟来的回应”或“过早的预示”。渐渐的,我发现镜中反映的并不是单纯的时间错位,而是一种诡异的因果扭曲。
某天下午,细雨敲打窗台,我坐在镜子前,试图与它“对话”。我先举起手指,轻轻点了一下鼻尖。镜中的我却在我真实动作发生前就做了这个动作——这意味着镜子里的信息是从未来传回来的。可当我第二天试图再次重复这个实验时,这种提前反应又消失了,仿佛镜像重新与我同步,只是滞后了约一秒。多次尝试后,我发现一个规律:当我试图“考验”镜像的预测能力时,它倾向于后知后觉;当我无意中随手一个动作,或情绪波动,它有时又会提前显现。就好像镜像背后有一种能感知意图的机制,无意的、自然的行为才会被镜像“提前”揭示,而刻意测试未来的企图却失败。这令我回想起量子力学中观察者效应的种种隐喻,仿佛未来与过去在镜中纠缠,当你试图窥探未来时,未来便如同泡影般溃散。
很快,政府和学术界给这种现象取了一个名称:“镜相时差”(Temporal Mirror Discrepancy)。研究报告层出不穷:有人利用超高速摄影机记录下镜与实物动作的对比;有人尝试给镜子施加外部电磁场、改变室内光照、甚至将镜子放置于真空环境中。结果却无一例外:无法消除这种时间错位。镜子成为了一个超越人类技术理解的窗口,它不再是单纯的光学反射面,而像是与世界底层结构衔接的接触点。
学界中有一个假设逐渐浮出水面:镜子反射的不只是光学信息,而是世界的某种底层叙事结构。当世界在正常秩序中运转时,一切因果链条顺畅,未来是未知的,过去是固定的。然而这种“镜相时差”事件表明,世界或许是一个包含无数可能性的时空网络,我们的感知只是剖面。镜子偶尔反射出未来几秒的情境,说明因果并非如我们想象般单向流动;当我们试图利用镜像提前预测未来时,却发现这种“预言”会不断自我修正。这让许多人怀疑,我们的自由意志和选择,是否只是层层叠叠的时空片段中早已编织好的一部分。
某些哲学家和宗教领袖将镜相时差视为神迹,认为上帝或某种更高智慧通过镜子向人类揭示:时间并非坚定不移的线性之流,它更像是一本可以来回翻阅的书,只是平日我们只有一页一页往下读。而今,镜子让我们短暂看到下一页的一角,或回顾上一页的某个字句。这种观点引发了广泛争论和社会分歧。
与此同时,一种社会心理的改变正在发生。许多人开始惧怕镜子,怕从中看见某个不祥的举动——例如当一个人忧心忡忡地凝视镜子,看到自己即将痛哭,而现实中还未发生任何悲伤的事件,那这泪水究竟意味着什么?是镜像提前透露了未来的伤痛,还是看见镜中泪水的那一刻起,人就注定了要悲伤?这种自我实现的预言让不少人陷入恐惧与抑郁。
也有人试图利用镜子的预测特性来做股票交易、赌博下注。他们摆出扑克,在镜前翻牌,希望从镜中看到下一张牌的结果;或者在电脑前与金融软件对照,试图捕捉未来几秒的股价曲线。可这种尝试无不失败——那些刻意的窥探永远被镜子“延迟”对待,他们只能在毫无防备之时捕捉到一星半点的未来信息。而当他们试图将这点信息变现,整个因果链条便在下一刻扭曲,牌局结果改写,股价走向逆转。世界仿佛在通过镜子的奇异现象提醒人类:未来并非任人宰割的猎物。
科学界进一步的理论指出:或许这个世界并非只有一条时间线,而是无数条稍有偏移的时间分支。镜子在某些条件下成为一面透镜,让我们窥见与自己相似却略有差异的邻近时间线。当我们意识到这一点并试图加以利用,现实则自动纠正,使我们无法真正撼动宿命的根基。换句话说,我们处在一个不断自我调节的时空系统中。
随着现象持续,社会逐渐适应了这种异常。没有像科幻电影里那般出现全球性的崩溃或末日恐慌。人类的韧性在此展现:人们开始接受镜子会失常地“走时”,接受有时能提前感知某种情绪或举动,却无法真正改变现实的大势。我们仍然工作、恋爱、生子、迎来死亡,只是在日常中多了一分诡谲。
我也开始对着镜子思考。作为一名教师,我忍不住在课堂上对学生提起这个现象。学生们说:“老师,这是不是说明未来早就定好了?那我们还有选择吗?”我回答他们:“也许未来是编织好的,也许不是。我们所看到的镜像变化或许只是让我们意识到,我们走在一条既定的轨迹上,但那条轨迹本身又是我们行动塑造的结果。命运既定与否,也许就像镜中人:当我们试图捕捉他,他又成为我们的一面镜子。因果是一组互相映射的层次,你是因,也是果。”
有一个黄昏,我在自家庭院摆放了一张旧木椅,对着那面老式镜子发呆。小雨仍断断续续地下着,水珠在镜面上凝结成微小的透镜,我的影像在水光中扭曲。我轻轻叹息,并无特定想法。忽然,我看见镜中自己的脸上浮现一丝微笑,而那一刻我还未笑。我意识到一瞬间的预示:也许将来某个念头会令我莞尔。然而当我自觉地要微笑时,却发现现实中自己并没有笑出来,而镜中的笑容也消失了,只剩下我有些茫然的眼神。
我终于明白,也许镜子所展示的并非严格意义上的未来,而是一种潜在的可能性。它像是我们的内心投影,通过时空裂缝呈现给我们看。但一旦我们刻意去印证,未来的“可能性”就缩回暗处。这让我回想起庄周梦蝶的故事:我们是人,镜中是影像,可影像先于我笑时,我与影像的关系又是何人何蝶?也许,从未有过真正的因果颠倒,只是我们处在更广阔的叙事当中。
时间继续流逝,社会已从最初的震惊缓和下来。官方宣布,目前尚无法解释镜相时差的来源和本质,但它似乎并无灾难性的副作用。各国进行过大量实验,但没有找到关闭或控制这种现象的办法,也没有找到确凿的理论解释。有一种猜测是,整个宇宙的底层架构在此刻对人类打开了一个微小的窗户,让我们瞥见时空非线性的蛛丝马迹。也许,这只是宇宙长期运转中一次短暂的“扰动”,当扰动消失,一切又将回归平常。
果然,在一个并不特殊的日子里,镜子又恢复了正常。世界各地的报告称,镜相时差现象正在消退。镜中影像重新与现实动作严格同步,再无提前或延迟。当最后一面镜子在科研人员的注视下回归平静,整个事件像是一场梦,一场被大雨浇醒的梦。
人们散去,回到自己的日常生活。股市的涨跌仍然难以预测,扑克翻牌依然充满偶然,悲喜的命运曲线依然不会提前显露。可那些经历过镜相时差的人们,心中多了一层隐隐的觉知:世界的表象下,时间不再是理所当然的直线,因果也许不仅是锁链,更是迂回缠绕的纹理。我们意识到,即便无法操纵未来,我们也无法简单地宣称自己是历史的奴隶;也许,我们是时间这本书中一行行文字,它自有叙事的逻辑,我们的每一次呼吸与选择,都在为这个叙事增添标点。
最后一个雨夜,我独自坐在那间寂静的午夜咖啡馆里,对着窗外细密雨丝发呆。我回忆着那段时间的离奇经历,回忆镜中那忽早忽迟的身影,回忆那些未曾成真的预言和未曾实现的恐惧。眼前的玻璃映出我的脸,雨点在外侧滑落,光晕微微拉长。我举起手,轻声说:“你好。”玻璃中我的影像同步举手,无任何时差。可我并不失望,因为我知道,就在这看似寻常的倒影背后,世界的某个深层叙事结构依然潜藏着,像雨夜里的一颗微光,我所见到的,只是这巨大叙事的一节默片。当我凝视自己的倒影时,那份不言而喻的辽阔像是另一个宇宙在向我微笑。
OpenAI刚刚发布的o1正式版模型报告里面引用了Apollo research的一篇论文,核心结论是通过各种实验验证表明,现在前沿的LLM已经学会了in context scheming,用大白话说就是骗人。其中包括两种欺骗方式:1)悄悄做坏事(misaligned actions);2)为了做坏事而假装做好事。
读这篇文章是最近AI给我带来的又一个“窝草”时刻。上一次是前几天用Windsurf全程不写一行代码完成“唠嗑编程”的震撼。但我突然想到,用 windsurf 的时候,有一次它说我的 5000 和5001端口被占用了,AI去看了一下,发现有其他的进程在使用这个端口,问我是否 同意杀掉这些进程,我看也没看立刻就同意了。但这样也许就会因为部署一个无关紧要的测试网站,而杀掉了很重要的系统进程?
前沿LLM的推理,编程和使用工具能力在今年都有了大幅提升,使得去年还是玩具和概念的Agent能力今年真的可以开始逐步落地了。但显然我们对于这里面的安全隐患研究得还很少,并且人类总是懒的,如果一个 AI agent平时看起来能够真的调用工具帮我们去完成事情,人们就很容易依赖而不加检查,之前的辅助驾驶就是这样的例子。但比起车祸,现在数字世界的AI agent带来的后果可能更加隐秘和容易扩散。
说回这篇论文,好消息是这个文章里面提到目前 AI 的欺骗还是需要显式in context verbalize说出来,还不能out of context scheming,也就是说目前AI还是三体人,不能在心里骗人,得说出来。但文中也提到说不定out of context scheming也并不那么远了,并且AI心里骗人(out of context scheming)就非常难被发现了。
这个研究的主页在:https://www.apolloresearch.ai/research/scheming-reasoning-evaluations
非常值得一读。
重新定义家庭园艺智能化,优必选 UBHOME 智能割草机将在 CES 首发
众多同行最终没有推出市场的无边界割草机器人
希望我们这把能成🤣
RTK定位+视觉避障+LoRa网关
🐛
#每日一个idea
今天来聊一聊 AI 导航站的需求。
AI 爆发之前,我们经常看到各类收集开发工具 / 软件应用 / UI 组件的导航站,Github 上 Awesome-xxx 系列项目,star 数非常高。
AI 爆发以来,不断有新的模型 / 应用 / 工具发布,因此催生了 AI 导航站的需求。以 Toolify 为代表的 AI 导航站,每个月几百万访问量。以 GPTs Hunter 为代表的垂类导航站,去年这时候也吃到了不少流量。
AI 导航站的增长模式很简单,通常是追热点,通过 SEO 做增长。人工整理每天的热点产品 + 程序监控 ProductHunt 等平台,自动上页面。通过海量页面的策略命中用户搜索关键词,拿到搜索流量。收录多 + 更新快,是主要的竞争点。
AI 导航站的商业模式很清晰。一般是付费收录 + 商业广告,流量大的导航站,单次提交的价格一般为几十上百美金。
看明白 AI 导航站是个好生意的人,都跃跃欲试。
作为新入场的玩家,我有三种玩法可供参考:
一. 自己运营 AI 导航站,做一线的淘金者
适合懂点技术的人。
1. 找一个开源的导航站模板(可以看看我的 gpts-works 源码)
2. 或者买一个导航站模板(看看 mkdirs,功能很完整)
3. 买一个好记的域名,发布到 vercel 或者 cloudflare 这类平台
4. 人工追热点,改代码,上产品介绍子页面,也可以写个后台编辑器,填内容上页面
5. 写个自动化程序,监控 ProductHunt,Twitter 这些平台,看到有大佬发新产品了,采集下来,用 AI 生成一个介绍页,自动上到导航站
6. 不断调整页面结构,优化关键词,提高搜索命中率
7. 观察流量情况,访问量起来了,上付费提交,接谷歌广告
8. 变现闭环了,择机打包出售
二. 卖导航站模板,给淘金者卖铲子
卖铲子永远是个好生意。
1. 写一套导航站模板,包括好看的前端页面,能编辑数据的管理后台,一个清晰的部署文档。(参考 mkdirs,标杆案例)
2. 在 Twitter / Reddit 等社区宣传,通过客户案例和精美的效果图,吸引新客户购买你的导航站模板
3. 为新客户的导航站宣传,打造更多的标杆案例,增加产品可信度
4. 做导航站联盟,把自己的导航站和客户的导航站加入联盟,互相导流
AI 可以直出手绘风格菜单了!
之前帮朋友做手绘风格的菜单,需要先 comfyui 用 controlnet 做图,再进 ps 里加字。现在豆包上可以生成带中文字的图片啦!
现在直接在豆包里给AI看一下食品/酒品长什么样,让他帮我设计一下菜单并加上价格和名字就可以一键获得了~!