AI社区正在流行的一个玩法,让ChatGPT基于和你的历史对话,画一个它想象中的你的生活画像,我的画像如图所示。
* Prompt - Based on what you know about me. Draw a picture of what you think my alter-egos life looks like
机器司机的数量超过了人类司机。智能革命浪潮里,机器对人的替代正在真切地发生,若干年后回望,这只是前奏而已。还是那句话,人们往往会高估未来2年内的变化,而低估未来10年的进步。摩尔定律的另一种解读就是,科技的半衰期正在以几何速度减少。
Читать полностью…核心辐射学习法
这是我常用的一种学习和思考方法。
学习一项新知识,新技术的时候。如果直接面对一整个庞大的系统性知识,容易产生畏难心理、记忆负担、认知迷茫等问题,同时容易陷入知其然不知其所以然的地步。
为了让自己更快更深的理解掌握一项新知识,我会希望尽可能的抛弃掉所有的复杂性,先从最小核心出发,再慢慢掌握基础,然后实践,然后提升,然后拓展。
以 RAG为例 (个人不专业的回答,欢迎批评指正):
1. 最小核心: 知识 + 指令 构成的提示词。 最简单的做法就是我们读文献的时候,手动将知识复制粘贴给AI (人工检索知识),然后要求AI 根据知识回答问题。
2. 基础层。人工检索效率低,所以最小核心的人工检索知识变为机器检索知识。
知识太多,无法一次输入,所以需要对知识进行分片,于是有了知识切片的各种方法。
为了检索的准,于是有了关键词检索,语义检索等技术。
为了进行语义检索,需要将文字转换为向量,所以有了转换的embedding 模型,要对这些向量操作,所以需要向量数据库。
机器将检索到的知识和指令结合构成提示词,引导模型生成回答。
3. 实践层。基本上使用上面这些就能构建一个小的rag系统,花时间实验,试错,调优。在优化的过程中发现更多问题,检索不准的问题,生成不理想的问题等等。
4. 提升层。为了优化检索效果,检索的时候使用各种混合方法,有些问题依赖的知识分布在多段内容中,因此使用多段内容。但是这些内容和问题直接的相关性等又有不同,希望筛选出最相关的,于是有了对检索得到的知识的排序,有了排序模型。为了进一步提升系统效果,使用更好的模型,更好的参数,对生成数据流优化,各个步骤上的参数测试优化等等。
5. 拓展层。进一步进行系统层面的优化,对系统稳定性,易用性,产品设计等方面优化。比如在实际使用过程中发现很多问题是重复的,这时候就可以构建缓存系统,第一次回答之后下次类似问题进来直接使用缓存的已有答案。
思考是这个核心辐射的逆过程,不断剔除掉外在的复杂性,观察事物是否成立,最后只保留下最小的不可去除的核心。
个人按这个思路,Agent 和 RAG 如果不断去除掉复杂性,最终保留到最小核心的话,可以回退到 prompt 的构造法。
Krea AI 上线了 Lora 训练功能。
上传最少三张图片就可以训练,界面和交互非常精致和直观。
FLUX Lora训练真的很简单,但是一堆产品没有一个再体验和交互上下功夫的。
Krea 真的活该成功。
使用 EARLYBIRD 邀请码前100个人可以直接获得权限。
果然只要是视频,字节就一定会整一个 SOTA 出来。
发布 X- Portrait2 单图生成面部视频技术。
效果吊打 Runway,甚至比 HeyGen 还好一点!!
面部和唇部肌肉非常自然而且生动,真实的有点离谱了。
妈的,这下 AI 脱口秀视频和对谈视频,还有表演技术彻底成熟了。
X-Portrait 2技术上的突破是:
他们构建了一个最先进的表情编码器模型,通过新的端到端自监督训练框架,能够从人像视频中自学习ID无关的运动隐式表征。
另外通过为模型设计过滤层,编码器能有效过滤运动表征中的ID相关信号,使得即使ID图片与驱动视频中的形象和风格差异较大,模型还可以实现跨ID、跨风格的动作迁移。
10$imz03KCW8b0$/
可凑单~【防泼水】骆驼外套男女同款风衣,领800元专属优惠券。
原价【1069元】,券后👉【269元】!
【叠加满300-50,凑单预估到手257.5元~超划算!!】【防泼水】骆驼外套男女同款风衣,4级防泼水,仿荷叶拒水表层,出门无惧下雨!户外徒步,无惧磕碰,柔韧抗撕裂材质~周全户外设计,驭风骑行!
点击直达⬇️
https://s.click.taobao.com/GRmHjHt
👇
自助领券: ok.gocodehub.com
支持淘宝/京东/拼多多/唯品会等平台的渠道券
自购领券,省钱多多,不领必亏
思考:
站在三年后的时间点, gpt 7来了,claude 5来了。大模型智能水平翻了十倍。
你觉得,prompt,rag,微调,这三者,哪个重要性上升最多,哪个最没必要存在?
基于你的答案,回到当下时间节点,你的方向和动作要做什么调整吗?
想清楚,坚持住。
离职流程终于走完了, 正式自我介绍下~
个人情况:
前某中型上市公司, 6年AI算法工程师, 算法团队负责人. 小型团队, 也造就了我全栈的能力.
现正式成为AI独立创业者.
爱好阅读、喜欢深度思考; 得到深度用户, obsidian, flomo深度用户
喜欢用工具也喜欢造工具. 1年emacs使用经验, 5年neovim深度使用者
相信AI寒武纪即将到来, 且躬身入局~
为什么:
1.因我本身就是做算法的, chatgpt发布后, 这两年算是经历了道心破碎和道心重塑的过程, 我使用AI在生活工作的方方面面, 从阅读、思考到实际做事, 思路与以往完全不一样. 所以AI对我自身能力的扩展是阶跃的, 同时我也热爱使用AI帮助更多的人.
2.我翻阅大量历史, 没有一次科技革命的影响是自上而下被设计出来的, 反而都是环境发展到了一定阶段, 各行各业各种产品自下而上生长出来的. 所以我要给自己创造环境, 一个尽可能对齐未来AI寒武纪, 应用大爆发的环境, 并置身其中.
目标(未来一年):
1. 关键是在接下来的一年中, 能够在以成功为目标的前提下, 允许自己快速试错, 获得感受和思考, 逐步成为下一个时代最需要的AI产品工程师 (我造的词哈哈, 指深度理解AI, 同时具备较高的认知水平, 理解人性和社会, 能够做出被时代需要的, 于时代有益的产品)
2. 所以这一年, 我的重点在赋能, 帮助我所见、识的人事物. 做有趣有用的产品出来, 赚钱是重点但不关键.
欢迎关注, 同时期待各种形式的交流, 也考虑各种形式的合作~
---
微信公众号: Kaijien AI
github repo: github.com/Kaijien
小破站, 得到, 某音,小🍠 全网同名: 凯祭恩Kaijien
如果你要走高频的路
那你的人生就只能越来越卷。
但还有一个选择
咱们回到那个低频的方向
回到一个产业的核心问题核心方案上面去。
我们看了很多很多AI
每个同事在市场上
见了很多很多大牛
做了很多很多访谈
然后我们有一个很年轻的同事
我跟他说你就别干其他的
你就把那些paper认真真读
读了不到半年
有一天我看他跟那些senior同事一起开会
我觉得他问的问题是更尖锐的
问的问题是更有深度的
为什么?
是因为他比那些人更定
所以看到了更核心的问题
所以今天这场分享之后
如果有一个同学今天回去了之后说
我去梳理我公司的核心价值/核心问题
我梳理我自己的核心能力
我让我自己安定下来去做那些长期的事情
那今天的这几个小时就是有功德
因为越在这个时候
我们都像热锅上的蚂蚁一样
我们越在这个时候越要找出路
我要不要出去我读个书
我要不要换份工作
我要不要今天能出去见人
我要不要企业马上转型
我要不要去利用好当下的热点
这都是卷的方向。
拆解出长期趋势
回到定的方向
这个东西才是今天这个社会跃迁的过程里面我们的解法。
所以最后就是希望
每个人在自己的人生中
找到自己的低频的信号。
from张津剑
42章经播客
《世界好像变难了,我们该如何应对?| 对谈绿洲资本张津剑之 AI、人 与 生命力》
腾讯今天开了个发布会一股脑的发布了一堆新内容,每个都很牛皮:
- 元宝 APP 能力更新,增加 AI 搜索应用,支持搜索 QQ 音乐和视频号内容;
- 开源最大规模的 MoE LLM Hunyuan-Large;
- 开源 SOTA 3D 生成模型,首个支持文生 3D 的模型 Hunyuan3D-1.0
元宝 APP 现在新上线了 AI 搜索能力。
同样支持具有推理能力的深度搜索功能,另外也支持了搜索微信生态更多模态的信息,这个太厉害了。
在数据层面直接吊打其他家,比如搜索结果里面会有视频号和 QQ 音乐的音频内容。
开源最大规模的 MoE LLM Hunyuan-Large。
总参数量达到 389B,激活参数量为 52B,预训练模型支持 256K 上下文长度。基准测试和数学推理能力基本超过了所有同规模的大语言模型。
Hunyuan-Large 会上线腾讯云TI平台,同步支持业务自主精调及部署测试。
另外还优化了推理架构,显著减少了 GPU 内存使用(KV-Cache 部分节省了 50%),通过 FP8 量化优化,实现与传统 FP16/BF16 量化相比内存使用减少 50%的同时保持精度。
Hunyuan3D-1.0 现在应该是最好的开源 3D 生成模型了,支持文本和图片生成 3D 模型。
主要的优势是是非常强的泛化能力,无论是建筑、角色、场景、生物都可以很好的生成。
采用两级级联模型架构,标准质量只需要 4 秒就能生成,高精度模型也只需要 7 秒。
你现在可以在元宝APP”3D 角色梦工厂“应用里面测试这个模型,上传自己的照片就可以生成跟你一样的多种类型 3D 模型。
Hunyuan3D-1.0:https://3d.hunyuan.tencent.com/
Hunyuan-Large:https://llm.hunyuan.tencent.com/
我从前愚钝时,也以为沟通撕裂只是单纯的二元立场偏差,但如今才明白,逻辑链是无限排列组合的,你说的话里每个token分段都能被挑刺。比如:
【今年TOP3学生求职好难!】
【今年】去年难道简单?
【TOP3】你说的TOP3是哪3个?
【学生】学生吃点苦咋了?
【求职】你想暗示该考研?
【好难】放屁,我求职就很容易
所以,说得越多,被挑刺越多。要么别表达想法,要么等着将来用我的AI产品试试
门户⇒UGC(博客空间)⇒UGC的timeline(web2.0 )⇒UGC的热度分发(热评)⇒UGC的个性化分发(推荐)
这是个丝滑的发展历程,每一步都是革命性的,不能因为崇拜张一鸣而孤立只关心最后一环
很显然,用AI来续写这个历程的下一步,也是顺理成章的唯一光明大路,也是killer产品诞生的必然出处。
但不知为什么,总有一些蠢货,一边故意精准避开这条路,一边抱怨没有kilker产品诞生
10$LPGp3pzoz4v$/
木林森春秋款三合一冲锋衣,领170元专属优惠券。
原价【309元】,券后👉【139元】!
得物同款230+!!我们到手才89!!
三效合一,一衣多穿,横穿三季~
290G/M²抗静电摇粒绒,保暖更舒适~
山系户外冲锋衣,专业级防风拒水,透气不闷热!
点击直达⬇️
https://s.click.taobao.com/iPlYIJt
👇
自助领券: ok.gocodehub.com
支持淘宝/京东/拼多多/唯品会等平台的渠道券
自购领券,省钱多多,不领必亏
昨天开始设计新产品
用 ideogram 和 figma 做了一套界面,效率超高
AI 生成的设计风格相当惊喜,审美绝对超过我的画图水平
用 figma 加工成可用界面
做完发给设计师朋友,得到一些反馈,再用 figma 改一改
齐活儿
创业团队可以省个设计师了
昨天设计好了产品界面。
今天把产品界面扔到 bolt new 里
它自动根据原型生成了代码写成的界面
还自动增加了很多有趣的小动画
比如
我在界面里画了一些星星
它实现的界面里,这些星星还会闪烁。。。
它写出来的app还是丑了一点,不能直接用,比较遗憾
脑海中有个概念:信息审美。
读书时代,随着阅读文字日渐增多,大脑对文字的感知分辨率也在提升,有点像品酒师能尝出各种葡萄酒的细微差别一样,有深厚阅读底蕴的人,也能感知到文字背后的韵味层次。
信息时代,信息过载,人类(可能)进化出适应信息社会的信息审美能力,每人拥有独属的信息偏好(不一定是离客观真相更近的),这个偏好在某种程度上定义了「我是谁」这个根本性问题。
AI时代,人类会不会发展出对于AI文本的特殊审美感知能力? 去ai味道,是一种审美, 那会不会有专门欣赏ai 味道的审美? ai生成内容很快,会不会有专门的抵抗派审美,追求慢,追求深度思考? 或者折中派,会不会有混合审美,人的思考结合ai生成,图文并茂,更上一层楼?
当下的ai,我感觉有两个利基市场,一个往下走,解决ai上手使用的问题(什么是ai,a场景有什么好用的x工具等等)。另一个往上走,解决之前人都搞不定(或不好搞)的问题。
当下ai圈的好多人,恰恰在这两者之间扑腾,既看不到(或看不上)前者的巨大套利时间窗口,也解决不了后者的难度。
ignoramus.
炒两个冷饭。
Anthropic 官方系统教程:包括提示工程交互、真实世界提示和评估;
微软面向初学者的生成式 AI 课程 V3:21 节课程教授开始构建 AI 应用程序所需了解的一切
微软面向初学者的生成式 AI 课程 V3:
https://github.com/microsoft/generative-ai-for-beginners
Anthropic 官方系统教程:https://github.com/anthropics/courses
🌐 ChatGPT Search vs. Perplexity:突破语言边界的创新
经过一段时间的探索和观察, 发现两者都非常强大,不能说谁完全胜过了谁; 但站在普通用户视角,我意识到ChatGPT Search的易用性、入口性和实用价值体现了其一流产品的水准。
在截图的简易对比中,Hans 尝试了两者在上下文理解、来源可靠性以及LLM 推理等智能水平。 特别发现有一点,对于中文用户来说具有突破意义:
「即 ChatGPT Search 的搜索来源不会因为你是中文输入,就只使用中文来源。这点异常关键~」
综合来说,我之前在Perplexity一直使用英文输入的习惯会被进一步巩固,而ChatGPT Search + Chrome插件的用法,则重塑了一条全新的工作流。 我相信它正在改变新一代年轻用户的使用习惯,这是新开始。
欢迎分享你的ChatGPT Search使用心得和新发现~#AI的神奇用法
10$9yVe3KC2Ru5$/
情侣羽绒服加拿大风时尚大鹅外套,领1000元专属优惠券。
原价【1158元】,券后👉【158元】!
大·鹅同·款羽绒服好·价!!!158起!!!!冬季刚需!!80%-90%的绒子含量!不同款绒子含量不同!长款、短款、情侣款都有哈!18-60岁都能穿的款式!男女老少通吃!
点击直达⬇️
https://s.click.taobao.com/qVxHjHt
👇
自助领券: ok.gocodehub.com
支持淘宝/京东/拼多多/唯品会等平台的渠道券
自购领券,省钱多多,不领必亏
大家在写 Prompt 的时候, 可以观察一下, 自己写的是「描述」还是「定义」。
你围绕着自己脑海中的那个「想法」打转,将看到的那一面表述出来,这是在「描述」它, 而这种描述很难说清楚何时停止, 你总会感觉还有一些地方没有说到。
另一种思路,是不在这些外围表现和特征属性上打转,直接找它的「本质」,使它成为它的那个「本性」。
简,准,狠。
Recraft 发布图形设计生成器,彻底解决海报生成问题。
干死 Canva 和 PS。
空白画布打字-选择风格-点击生成只需要三步。
10 张 Perplexity 宣传图只需要 30 秒,点就完事了!
腾讯这次真的是把家底儿都掏出来了…
今天还把自家最好的大模型开源了,就是元宝、微信读书、QQ音乐里的同款模型
- 389B 的 MoE 模型,激活参数 52 B,256K 上下文,7T 训练量
- 免费,可商用
- 各种指标都非常好
- 代码能力非常强
还发布了技术报告,把 MoE 的技术心得全部公开了…
简直中国 Meta
官网地址:https://llm.hunyuan.tencent.com/
Github地址:
https://github.com/Tencent/Tencent-Hunyuan-Large
Hugging Face 地址:
https://huggingface.co/tencent/Tencent-Hunyuan-Large
张鹏对谈李开复:AI创业进入洗牌阶段了吗? | 万字播客脱水总结
AI转录+自己精校了几遍,确实是值得一读的好材料,李开复分享了很多一线洞见(甚至有价值几百万美元的“苦涩的教训”),推荐给大家~
我愿意称google的AI工具learn about为最强大的学习工具!!!
不仅图文并茂,而且非常懂得如何去教授一个新概念
比如针对二区训练和营养之间的关系,打比方汽车引擎和汽油之间的关系
同时能够从二区训练延伸到线粒体 AMPK超级硬核的知识
真的太强了,我用过最好的学习工具,效率太高了!!!!!