atashare | Unsorted

Telegram-канал atashare - 鲲的碎碎念

8797

分享实用的、小众的网络资源和资讯。 原神频道 @YuanShen ATA Bots @atabots 🎉 友链: RSS 订阅聚合 | @dailyrss 美图 | @beautygirls9527 CN导航 | @CN_DH 书墨资源 | @shumozy 404 KIDS SEES GHOSTS | @isaiahsystem 开源社区资讯 | @opencfdchannel

Subscribe to a channel

鲲的碎碎念

Vue 的第一大全栈框架 Nuxt 被 Vercel “收编”了 [1][2][3]
这下 Vue 和 React 生态下的两大巨头都在 Vercel 手里了😂很难说这是好事还是坏事

好事是 Nuxt 团队的资金压力减小很多,更专注于开源事业。
- Nuxt UI Pro 会免费
- 会开源 Nuxt Studio 允许自部署

坏事是 Vercel 在前端的话语权进一步扩大了,有形成垄断的风险。

Читать полностью…

鲲的碎碎念

https://github.com/huggingface/transformers/pull/36878

Qwen3 要来了🤔

Читать полностью…

鲲的碎碎念

TypeScript 宣布原生移植计划,性能将提升 10 倍

TypeScript 团队宣布将编译器及工具链移植至原生代码(Go 语言),目标在 2025 年实现里程碑式性能突破。新版本 tsc 编译器在主流项目测试中展现出 10 倍速度提升:VS Code 代码库类型检查耗时从 77.8 秒缩至 7.5 秒,编辑器项目加载时间更从 9.6 秒优化至 1.2 秒。该方案还将内存占用降低约 50%。

原生版本预计 2025 年中发布命令行检查工具,年底完成全功能支持。现有 JavaScript 代码库(TypeScript 6.x)将与原生版本(TypeScript 7.0,代号 "Corsa")并行维护,确保平稳过渡。升级后将支持实时全项目错误检测、高阶重构功能,并为 AI 开发工具提供新基建。

团队将于 3 月 13 日举办问答活动,开发者可通过 GitHub 仓库追踪进展并参与测试。此次性能跃迁被视为开发体验的革命性升级,或将重塑现代 TypeScript/JavaScript 开发范式。

Microsoft Devblog | Github | FAQ

📮投稿 ☘️频道 🌸聊天 🗞️𝕏

Читать полностью…

鲲的碎碎念

https://zhuanlan.zhihu.com/p/27181462601

DeepSeek 官方直接把自己的成本和收入也“开源”了👀

Читать полностью…

鲲的碎碎念

发现个有意思的东西:

如果用 GPT-4o 模型问它 Deepseek controversy 这个问题,在生成第二轮搜索词的时候会出现很多 undefined。排查半天,发现原来 GPT 返回的搜索词就是 undefined。。。如果明确叫它不要写 undefined,就正常了。

这是触发了 GPT 的一部分比较低质量的知识?

Читать полностью…

鲲的碎碎念

推荐前 OpenAI 员工 Andrej Karparthy 的视频:Deep Dive into LLMs like ChatGPT(《深入了解 ChatGPT 等大模型》)

深入浅出地讲述了目前流行的大语言模型大概是怎么做出来的、本质是什么、有什么局限性等等。如果你感兴趣,建议静下心来,跟着他的思路走完这 3 个小时。

在 AI 被部分神化的现状下,是非常好的祛魅手段,有助于让你变得更理性。我可能也会分享一点我觉得有意思的点。

B 站有不少翻译,比如 BV19ZN8eVEsS

@atashare

Читать полностью…

鲲的碎碎念

SiliconCloud Stats:硅基流动用量分析

最近硅基流动这家大模型 API 服务商比较火,本人已经使用几个月了,总体非常满意。但是它官方的分析功能比较简陋,我经常想看用量走势,于是做了个小工具给自己用,顺便也开放出来给有需要的人。

这个工具本质上使用 Cookie 来访问自己账号里的数据,项目部署在腾讯云 EdgeOne Pages 上面,无服务器架构,不保存任何数据。

Demo: https://siliconcloud-stats.ataw.top
源代码: https://github.com/AnotiaWang/siliconcloud-stats

@atashare

Читать полностью…

鲲的碎碎念

最近 DeepSeek 俨然填满了我身边的大部分科技类信源,在狂欢之后(之中?),想综合最近看到的信息以及实际使用体验,总结我的一些想法,可能不成熟。

1. 首先,DeepSeek 在国内外产生巨大反响,我觉得主要是它暂时打破了国外头部厂商在这几年有意无意培养的一个认知:搞 AI 会越来越烧钱。

以 GPT 系列为例,从传统的文生文模型 GPT 3.5,到多模态模型 GPT 4(o),再到现在的思维链模型 o1 和实时语音模型 GPT 4o Realtime,API 的价格目前遵循着“推出新品(贵) -> 优化性能或者推出小模型(降价) -> 推出新品(贵)”的周期。而网页版的 ChatGPT 会员价格从 Plus ($20) 涨到 Pro ($200) 甚至传言的 $2000,Sam Altman 还频频表示 OpenAI 一直在亏损,都传递出“大模型越来越烧钱”的信息。

于是 DeepSeek V3 和 R1 发布后,美国研究员们发现 DeepSeek 居然只用 GPT-4o 的 1/10 或者更低的成本,就做出了在一些方面追平甚至超越 4o 和 o1 的模型,560 万美元的成本比 Meta 一些高管的工资还低。人们自然而然地产生了问题:为什么我们之前要花那么多钱?怎么和投资人交代?所以微软等机构开始质疑,试图找 DeepSeek 的漏洞。同时,很多机构也在复现和部署(例如微软 Azure 云就搞了推理服务),尝试趁着 DeepSeek 官方服务超载的时候分一杯羹。

但长期来看,AI 烧钱的主旋律还会继续。一方面,DeepSeek 是在国内被制裁的环境下,用有限的硬件一点点抠出来的性能(比如说,他们用英伟达的 PTX 语言做了很底层的优化);另一方面,探索新技术也很费资源,如果手里的资源不够,甚至连技术的验证和迭代都跑不快。DeepSeek 主要证明了现有硬件性能还有挖掘空间,并且不但 N 卡可以流畅地部署大模型,A 卡和华为昇腾等国产显卡也能(前者 DeepSeek V3 已经首发支持,后者硅基流动已经和华为云合作实现)。“低成本高效率“和“高成本高效果”这两条路本质也不冲突。

> 这里补充一下,国外推出的不少推理服务主打的其实是隐私与合规性。因为 DeepSeek 官方是会用对话记录改进模型的,并且作为一个 🇨🇳 产品,很多老外天然排斥。如果把模型部署在海外,然后再特意备注“我们不收集对话记录”,不就成为卖点了?
> 另一方面,微软一边质疑一边火速推出服务,也能看出微软作为巨型企业,不同部门有不同的行为逻辑,政治和商业行为不冲突。

2. DeepSeek 的局限性。咱程序员当然不能像自媒体那么沸腾。DeepSeek V3 和 R1 当然也有缺陷:
- 它俩是专攻文生文方向,是将有限的资源集中到了一个点上。这两个模型都不支持多模态,官网虽然支持图片输入,但本质上使用了 OCR。不过反过来说,“专心做好一件事”也有可能是它出圈的一个因素。
- 目前在工程化产品中的帮助有限。像豆包、通义千问这些产品直接从用户接收输入,大模型直接输出给用户,没有固定的限制;而在其它一些产品里(比如说面向程序员的编程工具),大模型只是产品功能的一个环节,需要稳定、格式化的输入输出。V3 和 R1 目前对 tool call 的支持都不算好,在编程这个垂直领域里,prompt 的遵循能力和效果比不上 Claude 3.5 Sonnet 等广受好评的模型。
- 最近的一个观点“在 R1 上可以抛弃 prompt 工程”,并不认同。在简单问题上确实可以简单提问,让 R1 自己推理完善计划;但复杂场景里这么干可能让它填充的细节变得脱离实际。更何况,即使给了充足的指示,它的效果有时候也一般(可能是特定场景的训练数据不足)。

> 评论区的图片对比了 DeepSeek V3(左)和 Claude 3.5 Sonnet(右)在 AI 代码编辑器中的表现。R1 的表现和 V3 类似。

3. 宏观总结一下 V3 和 R1 的意义
- 在现有的技术大框架下,提供了一种高效率的新思路,并且透明开放。
- 在大模型领域培养了好的人才
- 给全国人民拜了个好年
- 让 AI 进一步靠近了普通人,强化了“中国的 AI 原来也这么好用,我们的模型有能力走向全球并被广泛认可”的认知。在现在这个节骨眼上,某种程度上来说,它的存在本身已经能成为历史的一个里程碑。
> 硅基流动 CEO——“这个想法有没有问题:这可能是一个历史事件,参与就是赢,赚不赚钱已经不重要了”


@atashare

Читать полностью…

鲲的碎碎念

🌟AI 资源推荐官测试中!

我们正在开发基于 RAG 和对话的资源搜索功能,目前正在验证可行性。假如效果好,将在未来集成进 @AliYunPanBot同系列机器人中!

测试形式:通过内部网页链接来体验搜索效果,并提供反馈和建议。网页版目前只用于测试,最终形态暂定为和机器人直接对话。

测试者要求:对 AI 感兴趣,愿意持续测试并提供有效的反馈;有大模型的开发/使用经验者更佳。

内测群链接:这里,第一批限 100 人;@AliYunPanBot 的 VIP 用户也可以直接申请参与测试,可以给机器人发送 /me 命令,将它回复的内容(包含会员有效期)转发给 @anotiaw 来获取资格。

Читать полностью…

鲲的碎碎念

#工具 #浏览器 #扩展

▎ Stolen Buttons(按钮窃贼)

官网 | Chrome 商店

一个本地运行的 Chrome 浏览器扩展,会自动记录你在所有网页上点击过的按钮,并统一展示。

可以用来分析自己的行为,看看自己每天上网都在做什么。是带有目的性的,还是在无意识地跟着网页的提示操作?

@atashare

Читать полностью…

鲲的碎碎念

#macOS #文件管理

▎ QSpace:强大的多窗格文件管理器

官方网站 | 专业版功能介绍

QSpace 是一款文件管理器,是 macOS 预装应用 Finder(访达)的平替。

Finder 的部分操作方式可能不符合直觉,对于使用过 Windows 的用户来说尤其如此。QSpace 在保留 Finder 相同体验的基础上,提供了丰富的个性化功能,提高文件管理效率。本人使用几个月以来感受很不错,已经替代了访达。

- 支持自定义几十种操作习惯,打造自己的舒适区;
- 支持多窗格管理,移动文件更方便,同时可将窗格保存为工作区;
- 内置压缩引擎;
- 支持自定义右键菜单和“新建文件”预设,并可快速在终端打开文件夹;
- 支持连接阿里云盘、Google Drive、OneDrive、对象存储、WebDAV、FTP 等多种存储服务(付费扩展);
- 强大的批量重命名工具(付费扩展);
- 积极更新,反馈处理及时;
- ...

使用邀请码:JEP9KT,开通专业版时可享受 10 元优惠🌟

@atashare

Читать полностью…

鲲的碎碎念

#GitHub

▎genact

github.com/svenstaro/genact

当你在应该干活的时候,假装很忙或在等你的电脑!在你的终端上生成各种耗时操作的输出,比如说部署 Docker、编译内核、连接僵尸网络等。可以用于在工位摸鱼,或者拍摄宣传片。

@atashare

Читать полностью…

鲲的碎碎念

热知识:用同一个邮箱帐号注册多个 OpenAI 帐号

在用户名后面加一个“+”号,接上任意内容,例如:

原帐号: username@gmail.com
这样有效: username+asd@gmail.com
这样也有效: username+114514@gmail.com
以此类推。

+ 号后面的内容通常被用作“标签”,实际对应的是同一个收件人。这也是 OpenAI 推荐的注册多帐号的方法,其它互联网服务同理。

@atashare

Читать полностью…

鲲的碎碎念

Catbox 文件上传机器人已更新,下载速度大幅提高,并解决了一些潜藏的问题。

- 机器人更新说明
- 什么是 Catbox 和 Litterbox

Читать полностью…

鲲的碎碎念

稍微把玩了一下 screenshot-to-code

1. 结论
干不了重活,这是肯定的。

对于 Telegram 官网这种比较简洁的布局可以拿捏,不过手机端布局也需要自己调;像 B 站这种上强度的就完全不行了,GPT-4 写复杂任务喜欢省略东西也是老毛病了。复刻 Vivaldi 官网则是搞错了布局。

2. 价格
复刻网页涉及到生成代码(GPT-4 Vision)和模仿网页中的图片(DALL-E),后者比较贵。

复刻 Telegram 官网花费大约 $0.4,包含一次生成和一次改进,其中生成图片的费用占一半多。剩余两个网页图片很少,每次耗费 $0.2 左右。

总之,如果要说 GPT-4 发布会的效果(当时随手画一张草图让 GPT 生成网站),那是合格的;但是目前别抱有太高期待。因为模型的输出长度受限,而且个人认为尚不具备比较复杂的组织能力。

@atashare

Читать полностью…

鲲的碎碎念

幽默 Dify,大半年了,社区反馈多次还修不好

Читать полностью…

鲲的碎碎念

https://developers.googleblog.com/en/experiment-with-gemini-20-flash-native-image-generation/
昨天谷歌的 Gemini 支持多模态输入输出了,挺好玩的,大概是大厂里第一个发布的?最开始是 OpenAI 在 GPT-4 时期画的饼,然后一直没实现

Читать полностью…

鲲的碎碎念

不是,中科院也部署了我的项目?
https://data.aicnic.cn/dms-html/index.html

Читать полностью…

鲲的碎碎念

用 Claude 3.5 Sonnet 修 bug 改来改去最后用回了第一版方案(等于什么都没改),给我气笑了,但是看它这么真诚又不好说什么

最后我把文件删掉,自己总结了一下整个过程的要点,让它重新写了一份。一遍过😐

Читать полностью…

鲲的碎碎念

Deep Research Web UI: 低成本体验 ChatGPT 深度研究

不用再花 $200 购买 ChatGPT Pro 了~最近 GitHub 上有一个非常热门的项目 deep-research,复现了 ChatGPT 的 Deep Research 功能。不过那个项目只支持在终端运行,那么有没有更方便快捷的方式呢?

有的,我给它做了一个网页 UI,可以实时展示整个搜索过程。可以看看视频里的例子。纯前端页面,API key 都存储在本地。

网站地址:https://deep-research.ataw.top/

代码开源,求个 Star:https://github.com/AnotiaWang/deep-research-web-ui

Читать полностью…

鲲的碎碎念

硅基最近唯一的缺点就是一堆新人涌进来,搞得我没法好好用 DeepSeek R1😡这几天想找个稳定的 R1 服务真难

Читать полностью…

鲲的碎碎念

今天硅基流动联合华为昇腾云服务,上线了 DeepSeek V3 和 R1 模型,价格与 DeepSeek 官方一致。感兴趣可注册体验

(我的云盘资源 bot 在大模型方面用量不小,试图回点血

Читать полностью…

鲲的碎碎念

近期频道评论区频繁出现此类骗术,请勿上当。原理是钱包开了“双重验证”,即使拿到骗子给出的助记词,也只能向钱包内转钱,不能转出。

Читать полностью…

鲲的碎碎念

#AI #大模型

▎ SiliconFlow

官网

生成式 AI 计算基础设施平台。

提供文/图/视频大模型的托管服务,目前有不少免费模型。付费模型的价格也很有竞争力(以 Qwen2-72B-Instruct 为例,每百万 tokens 的价格为 ¥4.13,相比之下 Together AI 的价格为 $0.9,阿里自己的价格为 ¥5 输入 + ¥10 输出)。

给普通人和开发者提供了有性价比的托管服务,可以快速用上最新最前沿的大模型;其 API 也兼容 OpenAI,可以直接用在现有的项目中。它目前也在和 沉浸式翻译 合作,可以免费用它的模型翻译。

注册可领 ¥14 额度,相当于 Qwen1.5-14B 的 2000 万 tokens。

@atashare

Читать полностью…

鲲的碎碎念

#工具 #网站

▎ 中国大学矢量校徽合集

免费提供大学的校徽矢量图,目标是覆盖教育部公布的全国高等学校 3000 余所,目前已经收集了超过 400 所。

提供 PNG、SVG、CorelDraw 矢量图源文件等资料下载。还会提供学校简介、是否 985/211/双一流、主管单位、视觉形象介绍(学校官网链接)等。

https://www.urongda.com

@atashare

Читать полностью…

鲲的碎碎念

阿里新开源的大模型 Qwen2-72B 的确有点东西,在我实际遇到的一个编程问题上,遵守提示词的能力和回答质量貌似比 GPT-4 和上一代的超大杯 Qwen1.5-110B 要好😲

Qwen2 回复速度很快。可能受限于知识库,一些写法不是最新的,不过至少核心功能写对了。然后重新生成的内容重复率很高,不知道是因为我用的托管方 (TogetherAI) 有缓存还是啥。

暂时没有和 GPT-4o 对比,因为我没开 API(号封太多了不想搞),在 ChatGPT 测试的话不好覆盖掉默认的系统提示词。可以关注下一些排行榜的数据。我也再体验一段时间。

@atashare

Читать полностью…

鲲的碎碎念

#GitHub #Go

▎ gh-proxy-go

GitHub 代码

简单的 GitHub 文件代理工具。修改自 hunshcn/gh-proxy,但是更轻量。要求部署的服务器能访问 GitHub。

Docker(镜像 12 MB 左右):
docker run -d -p 80:80 --name gh-proxy-go anotia/gh-proxy-go

命令行运行:在 Releases 下载对应平台的二进制文件运行,或者使用 Go 编译后运行。支持 --port--host 参数。

已知问题:不支持原项目的 Git clone 和黑白名单功能。做修改主要是为了节约硬盘空间(原项目 Python Docker 镜像接近 1 GB 是真的接受不能),本人未用到上述功能,因此没有实现(或者说修复),欢迎 PR。

@atashare

Читать полностью…

鲲的碎碎念

#GitHub #记账

▎ Wallos:付费订阅管理工具

Wallos 是一个网页项目,可以记录和统计自己在各种服务上的消费情况。

- 支持中文,支持微信 / 支付宝 / 加密货币 / 银行卡等常见支付方式
- 可以自定义货币列表,并且可以自动将金额转换为一种货币以便统计
- 支持创建多个付款人
- 支持在服务到期前发邮件提醒续费(需自备支持 SMTP 的邮箱)
- 有一个分析页面,可显示每个人每个月在不同领域的花费
- 支持自己上传每个服务的 Logo
- 支持 Docker 部署
- 支持深色模式

GitHub: https://github.com/ellite/Wallos

@atashare

Читать полностью…

鲲的碎碎念

#GitHub #终端 #Linux #macOS

▎终端年报 - cmd-wrapped

人们常有总结的习惯,对于常伴程序员的终端也是如此。cmd-wrapped 支持读取 Bash 或 Zsh 的命令执行记录,分析并生成一份“年度报告”。

程序支持 Linux 和 macOS,功能有:
- 按天数显示执行命令的次数,并生成类似 GitHub 的热度图
- 分析一周中最常使用终端的日子
- 分析一天中最常使用终端的时间段
- 分析最常用的程序
- 一些极限值,比如(终端记载的)第一次使用日期、敲命令最多的一天等
- 按年份统计数据

GitHub: https://github.com/YiNNx/cmd-wrapped

@atashare

Читать полностью…

鲲的碎碎念

#GitHub #AI

▎screenshot-to-code: 用 AI 快速复刻网页

GitHub | 网页版

此工具基于 GPT-4 Vision 和 DALL-E 3,可以根据网页截图制作“仿冒品”,并且可以选择技术栈。

- 可以根据截图复刻网站;
- 可以根据网页链接复刻网站(借助了 ScreenshotOne 的截图能力,需要申请 API Key)
- 目前支持 HTML + Tailwind / React + Tailwind / Bootstrap / Ionic + Tailwind 四种技术栈,后续应该会支持 Vue

计费方面,可以花 $15 购买 100 次生成次数,也可以使用自己的 OpenAI API 密钥。如果选后者,帐户需要有 GPT-4 Vision 使用权限,也就是说需要产生过至少 $5 的扣款

这个项目相当于把 GPT-4 当初发布时画的一个饼给单独实现了,提供了人性化的操作界面,并且完成度不错(可以自己选择技术栈)。并且支持私有部署,是一个不错的开源项目,适合快速复制一个简单网页的框架,方便自己开发。

@atashare

Читать полностью…
Subscribe to a channel