aigc1024 | Unsorted

Telegram-канал aigc1024 - AI探索指南

19409

关于ChatGPT、Bard等人工智能、思维方式、知识拓展,能力提升等。

Subscribe to a channel

AI探索指南

F5-TTS 加上 Facefusion 3 加上图生视频,你就能制作任何一个名人的虚假视频。

F5-TTS 和 Facefusion 3 都是开源的。

Читать полностью…

AI探索指南

prompt:逻辑之刃

扔进一篇文章,直接抽骨架出来

https://mp.weixin.qq.com/s/IFHOJfP3V7TM865inhKWvA

Читать полностью…

AI探索指南

手搓机器人第三版
马上要出咧(你是瞅啥?瞅你咋滴)

项目逐步从兴趣共学转化往科创与商业化落地

核心是控制成本与迭代创新

Читать полностью…

AI探索指南

Kimi一个季度花了一亿多买流量…😅现阶段没有什么用户忠诚度可言,纯粹是教育市场和烧钱了呀…
而Kimi App+Web差不多32M的MAU,豆包在60M左右

资料分别来自:公众号瑞琦和杨昌,由App growing统计;AI产品榜

Читать полностью…

AI探索指南

Clone的《西部世界》第一集开始 |CyberRobo

人类能制造工具这一能力估计是其他什么文明的科技发展里程碑。

Читать полностью…

AI探索指南

手搓机器人成长记—基于Arduino的桌面机器人,简化版Looi_哔哩哔哩_bilibili

终于突破了人脸识别跟踪了,从rust的 opencv,到 node的opencv,分类器,又换了tensorflow,一路下来换了10几个方案,最后用了face-ip算是暂时解决了。

很难得的是,克制了自己想要直接动手改代码的冲动,全程AI辅助完成了。

Читать полностью…

AI探索指南

Mac 上最顺手的翻译和OCR软件大更新。
支持了一大波各种大模型 API。
同时智谱还赞助了一个免费的 API,开箱即用,善莫大焉。
独立开发者和大模型公司的这种合作还是很好的,各取所需。

Читать полностью…

AI探索指南

马上要万圣节了,今天刷到一个Lora很应景,有做中式恐怖内容的朋友可以试一下。

中式恐怖妆造,味道确实很正,大白天看的我都害怕。

详情页胆小慎入。

这里下载:www.liblib.art/modelinfo/42dd2c71701c41f1b4c786cca420bcd0

Читать полностью…

AI探索指南

Arc 浏览器的公司宣布,将不会有 Arc 2.0
因为 Arc 虽好,但是很难上手
而一旦上手就成了死忠,拒绝交互的改变
于是官方决定尊重用户,直接开发一款全新的,AI Native 的,每个人都会操作的新产品。
新产品没有名字,甚至可能不是浏览器,那是什么呢?
只能从这个视频的一些 demo 里自己感受了

Invalid media: video

Читать полностью…

AI探索指南

Claude 很强。
我老婆发我一张别的学校的试卷,想让我打印出来给娃做,我用 Claude 一分钟搞定了。
甚至还可以发布为在线网页 https://claude.site/artifacts/8d59af67-b024-4bba-8dd9-48853afc7322

Читать полностью…

AI探索指南

✨ 好文推荐:AI 不是效率工具,它是意义放大器

Every 专栏作者Rhea Purohit 这篇《你可能用错了人工智能》极具洞察。和她一样,很多人没有找到正确打开AI的方式,更不用说拥有持续的好奇心和融入日常的工作和生活。

作为一个AI 布道者,Hans 也曾多次分享, 不要仅将AI作为效率工具,而是深入你日常创造的伙伴。 而Rhea 说的更好,她建议要让AI服务于你的意义。

这并不抽象。

如果你在真正的写作,会意识到你不需要AI 那些无意义的观点和文本;你需要它激发出来具有共鸣的内容。因为只有你持续为自己而写,智慧才会涌现。

如果你在创造产品,会意识到你必须自己先有洞察和思考;然后Claude和GPT的深度对话才开始具有商业价值;那个初心,AI 难以赠送给你。

更广泛地学习和研究也是一样:无论Notebook LM和Perplexity 多么强大,如果你没有一个真正的项目,它们的持续升级对你毫无意义。

这就是这篇文章的精彩指向。

https://every.to/learning-curve/you-re-probably-using-ai-wrong

Rhea 用自己作为作家的故事,找到这一深刻的领悟。它将启发更多人重新审视AI和自己的关系。 Enjoy~

Читать полностью…

AI探索指南

腾讯新出的这个 ima AI 知识库感觉有点上道了。

结合笔记软件和 AI 搜索,可以直接将搜索内容加入知识库和笔记列表。

写笔记的时候可以使用 AI 扩写和编辑笔记内容。

软件设计的一些小细节也很有意思,比如输入框有内容的时候熊猫会看向右边。

如果他要是再有一个浏览器插件的话我真会用,而且他现在可以总结非国内网页。

Invalid media: video

Читать полностью…

AI探索指南

国内AI这一波,暂时字节领先,这个应该是共识了吧。

Читать полностью…

AI探索指南

prompt:苹果文案

https://mp.weixin.qq.com/s/JGETvF5IQQ2HLI-MHWWBWQ

Читать полностью…

AI探索指南

Ideogram 终于做了一个发挥他们模型能力的功能 Ideogram Canvas。

可以在无限画布上对生成的图片进行编辑,比如扩图、局部重绘,以及最基本的生成功能。

我提前几天体验了一下,发现真的很适合用来做海报之类的运营设计。

因为Ideogram新模型的排版和文字能力真的很好,比如我之前说可以用来设计网页。

但是由于长宽比的问题,没办法完成一整个网页,现在没问题了,哈哈。

Читать полностью…

AI探索指南

AI降本增效,一开始最好简单粗暴。

差生文具多,如果要做优等生,先得抛弃对工具无休止的追逐。

哪怕是AI博主,也应该回归基本,主动熵减,把日常使用的AI工具控制在 20个以内。

我的工作场景主要围绕AI职场办公,智能体开发和媒体制作。如果按付费意愿,真正会坚持用的会有以下几个:(无广)

1.主力AI模型
GPT+Claude
平替:豆包+文小言(移动版)+kimi
GPT越来越有被Claude替代的趋势,尤其是代码。但是GPTs还是增强了我的使用粘性。豆包的TTS语音国内无法被替代。文小言有一些我喜欢的功能,比如信息聚合订阅。

2.主力IM
飞书
平替:Notion+企微
我知道Notion很强。但是鉴于复杂的操作+国内网络不稳定+数据安全是真不太喜欢用。
创业以来我觉得最值得投入学习时间的并不是任何一款AI软件,而是飞书本身。好的SaaS就是最佳实践的产品化。企微是出于私域+客户对公不得不用。

3.数据分析
Excel+GPT+各平台数据看板
平替:飞书多维表单
Excel没有平替。AI只是帮我解锁高阶功能,比如VBA和宏。多维表单的插件生态值得投入时间学习。

4.设计
Midjourney+ideagram
平替:Canvas+稿定设计+佐糖
比起Mj,Ideagram的出图更具场景感,配合简单工具出海报+商图+封面+运营位都很方便。

5.PPT
PPT+islide插件+彩璇PPT
平替:Gamma,aippt
目前没有同时满足不要钱、支持定制模板、不科学上网、智能还可控性强的方案。但是PPT+islide已经增效超过50%。Gamma是应急神器。
彩璇PPT比较小众,是一个方便做课件分享+编辑的平台,对咨询师/老师有刚需。

6.剪辑
剪映(含AI)+即梦AI
初学者够用,为了省事就用字节系的。

7.文本创作
飞书文档+flomo+GPT
平替:记事本
简单点好。如果开发一个支持flomo api导出直接AI生成标题/思路/文章大纲的工作流会不会有需求?

8.智能体开发
Coze/Dify
平替:百度智能体
目前还在钻研工作流场景。已经做了20多个Bot。Coze/Dify各有千秋,百度则是打通了支付环节和数字人形象的交互。待继续钻研好和大家分享。

9.代码辅助
Cursor+Claude
平替:字节豆包Marscode

10.工作流编排
Coze+飞书+各类Github(开源项目)
通过飞书机器人平台把各类BOT接入到飞书群里。实现在IM办公软件中使用自己调试过的AI数字员工。

#AI工作流

Читать полностью…

AI探索指南

收到了中国美术学院彩虹闪闪的领航员证书!

Читать полностью…

AI探索指南

10月还没结束,国产AI就在投流上杀疯了

10月还没结束,部分国产AI就在投流上杀疯了。比如,Kimi10月投放量飙升,20天投出1个多亿,接近整个Q3的总和。

而在巨量的投放金额之下,部分AI自媒体已接满了商单,成为本轮AI浪潮中少数「真正赚到钱」的AI创业者。

通过深扒12家国产AI150+投流素材,我们初步发现了AI自媒体们的“掘金密码”。

下面是调研出来的“非共识”:

1、Kimi主攻渠道,已经不是我们印象中的B站信息流,而是字节系的穿山甲

2、2024年的国产AI,更像是披上AI外皮的教培。

虽然各家主打功能和目标用户都有所侧重,但教育始终是各产品的重点布局方向。

3、对国产AI 来讲,或许哪里有“求上岸”,哪里就有增量人群

4、如果普通人要学某款AI,最好的办法就是看数据最好的几个广告。

它们比常规教程更赏心悦目,他们比极客的分享更通俗易懂。而且,看完之后我们的网感也会更上一层楼。

更多详情,见链接:

Читать полностью…

AI探索指南

重磅,敏神更新了 Flux 版 ic-light 模型。

可以:自动抠像、利用 flux 能力生成准确的背景、自动匹配光影合成,生成新的图片。

能想到对肖像、电商、美术等行业都会有很大帮助。我自己试了下除了人像以外,product id 也保存得不错。

▶ 试用地址:huggingface.co/spaces/lllyasviel/iclight-v2

▶ 项目地址:github.com/lllyasviel/IC-Light/discussions/98

Читать полностью…

AI探索指南

清华黑客松第三名!周五参加声网大会时突然想到这个idea,周六中午开始开发,一天时间build一个多模态ios应用,队友起的“智图ai”这个名字我也很喜欢。

-初衷是参会时发现所有人都在举着手机拍ppt,突然想到我相册里有超过一半是ppt照片、但却几乎没有再看过。没有删掉、是因为觉得哪天会再看,没有再看、是因为查看相册的效率太低了。

-所以做一个图像理解将ppt照片里的信息结构化提取、便于查阅回顾、甚至再进一步进行知识管理,似乎是客观存在的刚需。

-今天中午开发完后,刚好@orange.ai 橘子老师来分享干货认知,于是就边听分享、边把ppt随手用app拍下来,然后自动提取信息、自动生成总结和思维导图,一切都是丝滑交互、几乎无感。

-橘子老师的分享非常棒、长达20来页,可称ai产品顶级认知。不过我只保留了其中5页分享给大家看,想听完整分享还是要去找橘子老师哈哈。

-有幸获得第三名,运气非常好!感谢主办方和评委,更感谢后端+prompt开发的队友、感谢产品建议+做ppt的队友!

-第一次参加黑客松,并且是以产品+前端开发的角色,也是更加意识到组建一支团队的意义。

这个产品方向确实挺有意思、并且还有一些新功能计划加上,虽然还没想好在做ai播客项目之余、如何推进这个项目,仍然诚邀对这个方向感兴趣的技术开发同学联系我、前端/后端/模型侧都可,也欢迎产品和市场(尤其出海)的同学联系我,大家一起开发出更多ai时代的好应用!

Читать полностью…

AI探索指南

📣今日上午优惠总结
===============
129.0🉐【骆驼旗舰店】情侣款防泼水运动工装裤
https://07qjpl4.kuaizhan.com/?_s=Lx4pM4
59.0🉐秋冬必备【骆驼】男女加绒长袖内胆卫衣
https://07qjpl4.kuaizhan.com/?_s=Px4pM4
199.0🉐199元王炸!骆驼官旗夹克冲锋衣
https://07qjpl4.kuaizhan.com/?_s=Qx4pM4
69.0🉐女款运动休闲圆领卫衣
https://07qjpl4.kuaizhan.com/?_s=Sx4pM4
59.0🉐路森!奥粒绒秋冬连帽卫衣
https://07qjpl4.kuaizhan.com/?_s=Vx4pM4
199.0🉐王炸!【骆驼】情侣防风防水登山服
https://07qjpl4.kuaizhan.com/?_s=0y4pM4
199.0🉐【骆驼】加绒情侣夹克冲锋衣
https://07qjpl4.kuaizhan.com/?_s=1y4pM4
19.9🉐冬款李宁纯棉防臭运动袜3双
https://07qjpl4.kuaizhan.com/?_s=3y4pM4
19.9🉐正品!!【李宁】纯棉袜3双
https://07qjpl4.kuaizhan.com/?_s=5y4pM4
399.0🉐叠服饰卷319!骆驼男装登山服夹克
https://07qjpl4.kuaizhan.com/?_s=8y4pM4
159.0🉐MY爆款2024冬季新款情侣羽绒服A
https://07qjpl4.kuaizhan.com/?_s=by4pM4
29.9🉐快锁库存!中国回力秋冬卫裤情侣款
https://07qjpl4.kuaizhan.com/?_s=cy4pM4
49.9🉐鸭宝宝7A抗菌男女同款亲子装保暖套装
https://07qjpl4.kuaizhan.com/?_s=ey4pM4
49.9🉐鸭宝宝男女同款加绒加厚六仿保暖防风裤
https://07qjpl4.kuaizhan.com/?_s=fy4pM4
359.0🉐【服饰券299】骆驼火山羽绒服连帽加厚
https://07qjpl4.kuaizhan.com/?_s=iy4pM4
29.0🉐【猫人】石墨烯抗菌男士内裤三条装
https://07qjpl4.kuaizhan.com/?_s=jy4pM4
27.8🉐【任选8件】南方黑芝麻糊到手24袋
https://07qjpl4.kuaizhan.com/?_s=ky4pM4
89.0🉐蒙牛低脂高钙中老年奶粉800g*2罐
https://07qjpl4.kuaizhan.com/?_s=my4pM4
52.0🉐特步秋冬保暖圆领加绒卫衣
https://07qjpl4.kuaizhan.com/?_s=ny4pM4

Читать полностью…

AI探索指南

大模型生产力绘图,来了!
全文:https://mp.weixin.qq.com/s/bJbZ9bwPXxlpyREqLKhDvA
下面这些图,都是Claude这类大模型帮我绘制

内容涵盖海报,PPT,思维导图,中国水墨风画,名片,游戏界面,物体 等等

AI 大模型尽管不是为制作图片而生,但是绘图能力现在也出奇的好。

相比mj, sd 这些生图方法,大模型制图能够真正意义上制作 海报,架构图,思维导图,流程图等生产力绘图,具备巨大的优势。

同时,在简笔画,留白大写意这种作品上,也有着出奇的表现。

我花了两天的时间探索大模型绘图的各种可能,按之前的习惯,写成了系统论述文章发布。

目前来看,大模型理解能力已经很好,输出的上下文会是一个不小的限制。如果输出的上下文能够更长,一句话生成一个复杂的app,一个PPT,都是可以的,这也是轻易可预见的未来!

和AI的成长性相比,人类还是太渺小了

Читать полностью…

AI探索指南

claude.ai pro 付费付不了啊,招行的万事达卡被拒绝了,求教各位有啥办法快速付钱搞定会员啊😆😆

Читать полностью…

AI探索指南

早上后知后觉的发现机器人已经在柜底待了两天了
智能机器人真是个傻蛋

Читать полностью…

AI探索指南

很久之前我就说过,用户的需求从来就不是写 prompt 指挥 AI
而是直接说需求「做个抖音出来」
这就是技术和用户之间巨大的 Gap

但是,就在刚刚...
我打开 bolt new,让它做一个抖音出来
它真的做了一个抖音出来...
😲
来看看这段录屏吧

Invalid media: video

Читать полностью…

AI探索指南

AI 神器推荐!自动分离人声与 BGM 音频 - 小红书

😍【AI 神器推荐—aifuse】之前刷短视频时,不时会发现自己喜欢的音频,但音频里时常又夹杂了很多人声,正好最近发现一个挺好用的 AI 工具,可以完美分离人声和音频,推荐给大家:https://www.aifuse.cn/
#AI的神奇用法

Invalid media: image

Читать полностью…

AI探索指南

PodLM 发布到 ProductHunt 了,这是一个好玩的 AI 播客创作产品,目标是将任何内容转换成有趣的播客输出,请大家帮忙投个票,感谢支持👇

https://www.producthunt.com/posts/podlm

Читать полностью…

AI探索指南

.
✅0噜必备‼️一定要领3️⃣次❗️必中❗️
第1️⃣次https://u.jd.com/MGV1i8c
第2️⃣次https://u.jd.com/MGV1i8c
第3️⃣次https://u.jd.com/MGV1i8c

Читать полностью…

AI探索指南

Meta 上周开源了一个端到端的语音模型 Spirit LM。

这个太重要了,居然没注意到。

这个模型有两个版本:

基础版: 适合进行一般的语音识别和生成,不包含情感变化。

高表现力版:可以捕捉语音中的情感特征,能够生成包含快乐、愤怒或兴奋等情感的语音。

主要特点有:

Spirit LM 直接使用语音标记、音高标记和声调标记 来保留语音中的表现力要素,不需要先转文本描述。

能够在不需要大量数据的情况下,完成自动语音识别、文本转语音和语音分类等复杂任务。

项目地址:speechbot.github.io/spiritlm/

论文:arxiv.org/pdf/2402.05755

Читать полностью…

AI探索指南

大的来了!

Claude 3.5 Haiku 和升级款的 Claude 3.5 Sonnet 也来了,Claude 3.5 Sonnet 推理得分超过O1。

而且 Claude 现在支持像人类一样操作计算机,通过查看屏幕、移动光标、单击按钮和键入文本。

升级 Claude 3.5 Sonnet 现在开放。computer use测试版也开放使用。

新版Claude 3.5 Sonnet介绍:

更新后的Claude 3.5 Sonnet在行业基准上显示出广泛的改进,尤其是在代理编码和工具使用任务方面取得了显着的进步。

它在SWE-bench Verified上的性能从 33.4% 提高到 49.0%,得分高于所有公开可用的模型,包括 OpenAI o1-preview 等推理模型和专为代理编码设计的专用系统。

它还将在代理工具使用任务TAU-bench上的表现提高,零售领域从 62.6%提高到 69.2%,在更具挑战性的航空领域从 36.0%提高到 46.0%。

早期客户反馈表明,升级后的 Claude 3.5 Sonnet 代表了 AI 编码的重大飞跃。GitLab 为 DevSecOps 任务测试了该模型,发现它在没有增加延迟的情况下提供了更强的推理能力(在各种用例中高达 10%)。

Claude 3.5 Haiku介绍:

Claude 3.5 Haiku 在各项技能上都有所提高,甚至在许多智能基准上超过了上一代最大的模型 Claude 3 Opus。

Claude 3.5 Haiku 具有低延迟、改进的指令遵循和更准确的工具使用能力。

Haiku 在编码任务上尤其强大。例如,它在 SWE-bench Verified 上得分为 40.6%,优于许多使用公开可用的最先进模型(包括原始的 Claude 3.5 Sonnet 和 GPT-4o)的代理。

教Claude使用计算机

为了使这些通用技能成为可能,构建了一个 API,使 Claude 能够感知计算机界面并与之交互。

开发人员可以集成此 API,使 Claude 能够将指令(例如,“使用我的计算机上的数据并在线填写此表格”)翻译成计算机命令(例如,检查电子表格;移动光标打开 Web 浏览器;导航到相关网页;使用这些网页中的数据填写表格;等等)。

在评估人工智能模型像人一样使用计算机的能力的OSWorld上。

Claude 3.5 Sonnet 在仅屏幕截图类别中得分为 14.9%,明显优于第二好的人工智能系统 7.8% 的得分。

当提供更多步骤来完成任务时,克劳德得分为 22.0%。

官方公告:www.anthropic.com/news/3-5-models-and-computer-use

Invalid media: video

Читать полностью…
Subscribe to a channel