

AI自进化
Foreword 最近看了一个文章,有点意思,有点想法,记录下来。 AI自我迭代 https://mp.weixin.qq.com/s/AXyCo0RRwW_HKLpkUx1jUg 这篇文章是 CSDN 编译的 Anthropic 长篇报告《When AI Builds Itself(当 AI 构建自身)》,核心观点是:AI 正越来越多地参与 AI 本身的研发,”递归式自我改进(Recursive Self-Improvement)”时代可能比想象中来得更早。 Anthropic 梳理了自己的研发演进路线:2021-2023 年人类工程师纯手写构建第一代 Claude;2023-2025 年聊天机器人生成代码片段、人工复制到 IDE;2025-2026 年 Claude Code 等编码..
更多基于 git 的零拷贝静态web服务器
无聊,产生了个crazy的想法。 git 内部用 zlib 压缩文件内容 Content-Encoding: gzip 也是 如果web服务器输出 .git 里的 静态 内容,是不是可以减一个二次解压/压缩步骤??? blob sha1 直接当etag? 跟AI较量了几轮,一开始它说做不到。因为 blob 的格式比较变态。因为 hello world... 在 .git/objects/ab/cdef... 里的东西是这么存的 zlib(blob 1234\0hello world...) I was like ???日他妈真变态啊。这前面是写死了 blob <size>\0 然后把文件内容放在一起,再压缩的。 .git 这设计脑子有病啊。。。为啥不是原始文件gz而是加个头去gz。。。 此路不..
更多AI 时代的软件自由
我一直很喜欢好用的软件。 GUI 软件里,Raycast、Fork、Tailscale 这类软件我已经用了很久。它们的交互、默认行为和完成度都很舒服,也会反过来影响我理解“好软件”应该是什么样子。 命令行软件里,Neovim、kitty、fzf、ripgrep,以及各类 Unix 风格的小软件,同样非常符合我的品味。它们更强调可组合、可脚本化和低摩擦的日常使用,这也是我一直很喜欢命令行环境的原因。 只是到了某些非常具体的场景,我会产生一些很个人的偏好。比如 Markdown 预览窗口最好从命令行直接打开,壁纸筛选最好能理解一点主观审美,AI 工作台最好贴合我自己的使用环境。这些需求夹在成熟软件之间,通常很难刚好被某个现成软件完整覆盖。继续找下去当然也可以,但现在“自己补一个小软件”的成本变低了。 这里说的..
更多Skills进阶
Foreword 前一篇Skills算是简单的试用,日常用起来也没问题。但是如果要给一个软件写 Skills,把软件能力变成 AI 可以控制并且能完成你设定 pipeline 的 Skill,实践起来就有一些不一样了。 这里以 MenuReel(连锁餐厅数字菜单动效短片编排软件)为例,记录一下实际落地时和「Blog 润色 Skill」这类简单 Skill 的差异。 其实 MenuReel 的程序接口还没全部实现,但我已经提前通过 Skill 写一套「模拟调用协议」,让 Agent 按真接口的方式逐步执行完整 pipeline,而不是口头说「我已经帮你创建好了 10 个镜头段落」。反复试用的目的,是发现 Skill 没覆盖的地方,以及产品、接口上缺少的能力,从而把接口和产品补全,真接口一上线就能正常用..
更多AI和柜台费
现在这个时间点,观察到两件事: 华为的大模型哑火。国内的AI圈反而没那么多恶臭拉踩舆论 雷不斯天天给MIMO搞新闻。一开始是免费用在Openrouter刷榜;然后在大家都玩按次数的 codng plan它家率先搞 token plan涨价;然后又是 100T 申请免费送;然后跟ds4同款缓存优化降价;然后又是给流失老付费用户免费一个月套餐 MIMO是很用力的去刷榜。why? 马斯克几百亿买 cursor,一个vscode套壳,why? 这两个问题,我在过去几周一直琢磨,那就是 AI 行业和 软件 互联网 最大的差别,他是有边际成本的。他的玩法变了 雷不斯刷榜的 Openrouter 和马斯克买的 Cursor,还有遍地开花的 “中转站”,而且据说有大厂买中转站数据去训练和蒸馏。 边际成本不为0 ,中间..
更多KVM/QEMU 初探
看过我其他文章的朋友应该能看出来,我一直是一个 self-hosted 爱好者。无论是折腾 PVE、网络,还是各种跑在自己服务器上的服务,虚拟化都是绕不开的一层。平时用起来倒是很自然,但越用越会好奇:一台 VM 到底是怎么被跑起来的?PVE 和 virt-manager 这类工具背后究竟做了什么? 这个学习计划其实搁置过很久。QEMU/KVM 的入口并不算友好,QEMU 参数、libvirt、KVM API、virtio、tap/bridge 每个方向都能展开,之前总觉得需要一整块时间才能系统梳理。现在有了 Codex 这样的 agent,反而终于可以释放一下这部分好奇心了。 当然,Codex 并不能替我理解 KVM/QEMU。它更像是一个可以被反复追问的搭子,真正有价值的还是我能不能问出下一个问题。 ..
更多使用树莓派 4 和 Moonlight 串流游戏的实践
家庭内网,串流打游戏是真需求,电脑放书房,在客厅电视玩,真的爽。设备清单Windows 11 PC,显卡 RTX5070,安装 Sunshine树莓派 4B,2GB RAM,安装 Lineage OS TV,以及 Moonlight 安卓版XBOX 游戏手柄小米电视 ES55千兆以上的有线家庭内网软件说明Sunshine 在 这里 下载Moonlight 在 这里 下载Lineage OS TV 在 这里 下载小声 bb ,这个开发者很牛逼,但他不允许其他人给他的固件做镜像重分发,必须到他那个满是广告的网页下载为什么我要选这些软硬件PC 不谈,显卡是中端显卡用树莓派和小米电视是因为,我家已经用这套设备很久了,基本上是完美的安卓电视体验,电视仅用作显示,不联网,所以就没有广告konstakang 给树莓派 ..
更多GPT‑5.5 Instant 发布
OpenAI官网介绍 GPT‑5.5 Instant 更智能、能提供更准确的答案,更少的筛选工作。Instant 现在更加可靠,在各个方面都显著提升了事实准确性,尤其是在对准确性要求最高的领域,提升最为显著。在内部评估中,GPT-5.5 Instant 在涵盖医学、法律和金融等领域的高风险提示中,产生的虚假陈述比 GPT-5.3 Instant 减少了 52.5%。此外,在用户标记为存在事实错误的高难度对话中,它也减少了 37.3% 的不准确陈述。GPT-5.5 Instant 是一款更智能的模型,在日常任务中表现更出色,包括改进照片和图像上传的分析、回答 STEM 相关问题以及决定何时使用网络搜索来提供更有用的答案。此次更新后,ChatGPT 模型的回复更加简洁明了,重点突出,同时又不失实质内容,并保留..
更多

DeepSeek近期对API服务进行了大幅降价
DeepSeek近期对API服务进行了大幅降价。新的价格信息,单位是 每100万tokens(约等于70-80万个英文单词) 的价格。具体价格取决于你选择的模型和使用场景:模型版本计费场景最新价格 (每百万tokens)备注DeepSeek-V4-Flash输入 (缓存命中)0.02元价格最低,适合追求高性价比和响应速度的场景。输入 (缓存未命中)1元原价为4元,已同步下调。输出2元原价为8元,已同步下调。DeepSeek-V4-Pro输入 (缓存命中)0.025元限时优惠,截至2026年5月5日。输入 (缓存未命中)3元原价为12元,已同步下调。输出6元原价为24元,已同步下调。全系列模型,输入缓存命中的价格已降至首发价格的 1/10。当前 deepseek-v4-pro 模型限时 2.5 折,优惠期至..
更多浏览器通过WebGPU上做AI推理
先说结论,在2026Q2这个时间点,通过浏览器webgpu 做 AI 不值得。 本来看官方demo跑得好好的,自己搓下来也觉得没啥,就一个小问题,fp32的模型有点大,最好换 q8 的。 q8的不能在 webgpu上跑,wasm也凑合用。原因是缺少一些矩阵乘法算子。开源库嘛,也理解。只是速度就慢了一点。 本来前几个月就这样平安无事,结果 transformers.js 升级到 v4,支持 q8 跑webgpu了,甚至 q4 q2 bitnet 这种高级货都支持了。满心欢喜的切过去,结果 webgpu 跟 wasm 一样慢? 于是就不甘心了。一路折腾,发现这个不仅跟算子有关,还跟硬件有关。甚至老掉牙的硬件不支持 shader-f16 。简单的说其实 GPU 原生支持最好的就 IEEE 754 fp32,f1..
更多