BLCL的博客小馆

pandocwpsoffice wordjavaOOXMLMathJaxMathMLdocxDejaVuMathTeXGyreCambria Mathlatex

基于 Java 内存流的 Pandoc 转 Word 公式乱码精准修复方案

2026-07-26

最近在使用 Pandoc 将包含复杂数学公式（如 MathJax 或 MathML）的 HTML 转换为 .docx 格式时，生成的文档在 Microsoft Word 中通常能够正常显示，但在 WPS Office 中打开时，公式出现字体正体斜体错误。问题排查到是pandoc和office都是默认使用Cambria Math作为公式字体，能准确处理数学中的斜体和正体。但是wps中默认不包含这个字体，所以没法正常渲染。wps默认使用DejaVuMathTeXGyre作为公式字体，却没有被包含在pandoc和word中。所以pandoc转化的docx文件要额外处理字体问题。第一点， Cambria Math字体不在wps，也默认不在系统里，pandoc的docx模板需要自带包含字体，这个问题不大。第二点，生..

DockerContainerd磁盘空间docker-root运维迁移

关于Docker 29之后的镜像存储配置的变更

2026-07-19

上周五晚上我正在撸代码，突然收到疯狂报警，服务器 / 分区使用率 92%！”。登录服务器一看，根目录确实快满了，但 /data（挂载在 vdb 上）还有大把空闲。但是我早就把 Docker 的 data-root 迁到 vdb 上了，怎么系统盘还是被撑爆了？ df -h 看了一眼，overlay 挂载点确实显示在 vdb 上，空间还很充裕。但 du -sh / 一查，根目录下 /var/lib/containerd 赫然占了 24GB！ overlay挂载目录和实际存储目录不在同一个地方，这什么情况，之前的服务器都没有出现过这个情况。一、问题检查 # 明明设了 data-root 到 /data/docker $ docker info | grep "Docker Root Dir"..

DifyCeleryGunicornGeventAI Agent高并发性能调优

Dify 生产环境性能调优：API 并发与 Celery 后台任务参数实践

2026-07-13

一、问题背景最近在整一个大模型的项目，生产环境用的是一台标准的 8核 16G 云服务器，上面自己独立部署了 Dify 平台。我们的业务主要已AI对话+工作流为主，没有大文件处理和知识库管理。不玩重活：完全没有大文件解析、数据集批量导入，或者知识库切片这种疯狂吃内存的“重体力活”。全是业务：纯粹的 Workflow 工作流和 Agent 智能体调度，里面塞满了各种大模型（LLM）节点，而且基本全是 Stream 流式输出。刚上线并发一上来，前端和 API 就频繁蹦出 504 Gateway Timeout。去服务器上一看，16G 内存还剩一大截，但 CPU 各个核心忙得不均匀，Web 请求排大队。进一步排查发现，Dify 的默认配置（尤其是官方 docker-compose.yml 及 .env ..

mysql内存溢出mysql优化out of memory

一次MySQL排序内存溢出的排查与解决实录

2026-07-06

我昨天刚踩完这个坑，顺手把排查过程整理了一下，希望能帮你省点时间。事情是这样的昨天下午，我正美滋滋地写着代码，突然监控告警响了。点开一看，一个跑了半年的MySQL服务挂了，日志里躺着一行刺眼的红字： Out of sort memory, consider increasing server sort buffer size 说实话，看到这个报错我第一反应是——哪个憨憨写了没索引的大排序？后来一查，不是代码的问题，是数据量涨上来了，原来默认的256KB真扛不住了。所以今天我就把整个排查和解决过程记录下来，希望对遇到同样问题的你有点帮助。先说说这个报错是啥意思 MySQL在执行ORDER BY或者GROUP BY的时候，如果数据量太大，内存里放不下，就会把数据临时写到磁盘上。但是呢，MySQL有个参..

FTPdockerrclonecurlftpfsSMB

Linux 云存储挂载记录：从 FTP 到 Docker 容器共享

2026-06-30

一份手记，记录我在使用 rclone、FTP、SMB 和 Docker 时踩过的坑与解决方案。最近给公司搭建共享文件服务，遇到一大堆坑。记录一下，查了一堆办法，没有完美解决问题。mac上无法读写ftp，所以想着把ftp挂载到目录，然后把目录用samba共享出去。几个服务都在docker环境中运行。 1. Linux 挂载 FTP 的传统方式 1.1 为什么 mount 不能直接挂载 FTP？ mount 命令是为内核支持的文件系统（如 ext4、NFS、CIFS）设计的，而 FTP 是一个应用层协议，并非文件系统。因此，执行 mount -t ftp ... 会直接报错，也无法在 /etc/fstab 中直接配置。 1.2 curlftpfs：基于 FUSE 的挂载工具 curlftpfs 利用 FUSE（用..

newsnews/OpenAI

OpenAI 考虑大幅降价，预计将与 Anthropologie 展开用户争夺战

2026-06-30

OpenAI 正在考虑大幅降低向用户收取的费用，以期从竞争对手 Anthropic 手中赢得客户。据知情人士透露，该公司正在考虑大幅降低代币（人工智能公司用来为其产品计费的计量单位）的收费。知情人士称，此举是为了应对该公司预期 Anthropic 也将采取的类似降价措施。企业高管们开始对人工智能的高昂成本感到不满。OpenAI 首席执行官萨姆·奥特曼在最近的一次活动中表示，成本已经成为“一个巨大的问题”。“我认为我们有很多方法可以帮助人们花更少的钱获得更多的价值，”他说。大幅降价可能会侵蚀两家公司的利润率，而由于人工智能系统处理查询和执行任务所需的计算资源成本巨大，这两家公司已经损失数十亿美元。OpenAI 正努力追赶其年轻的竞争对手，力图赢得那些愿意为提升工作效率的人工智能工具支付巨额费用的企业客户。Anth..

newsnews/spacex

埃隆·马斯克的 SpaceX 计划投资 550 亿美元制造人工智能芯片

2026-06-30

Elon Musk’s SpaceX Plans $55 Billion Investment to Make A.I. ChipsThe rocket company’s new semiconductor factory, called Terafab, is part of the billionaire’s increasing efforts to dominate artificial intelligence.埃隆·马斯克在德克萨斯州建造巨型计算机芯片工厂的雄心勃勃的计划规模正变得越来越清晰——而且令人震惊。根据周三在德克萨斯州格莱姆斯县（工厂选址地）提交的一份公开听证会通知，由他的火箭公司 SpaceX 牵头的芯片制造项目第一阶段至少耗资 550 亿美元。总支出可能达到 1190 亿美元。该项..

newsnews/deepseek

China to Invest in DeepSeek at $50 Billion Valuation

2026-06-30

DeepSeek 正在从政府支持的投资者那里筹集资金，这使得这家人工智能初创公司与北京推动技术自给自足的政策保持一致。据知情人士透露，在最近的洽谈中，一些潜在投资者对 DeepSeek 的估值约为 500 亿美元。此前的讨论中，DeepSeek 的估值预计在 100 亿至 300 亿美元之间，但近几周来，其估值大幅上涨。据知情人士透露，中国国家人工智能产业投资基金（一个成立仅一年、资本规模约88亿美元的政府支持基金）正在就以人民币进行本轮投资进行深入洽谈。据知情人士透露，总部位于杭州的DeepSeek计划在新一轮融资中筹集数十亿美元。该公司计划利用这笔资金推进研发并扩展计算基础设施。部分知情人士还表示，深思熟虑科技希望通过此轮融资确定市场估值，以彰显其价值，并为员工股票期权激励提供基准，从而帮助留住顶尖人才。..

newsnews/nvidia

英伟达凭借强劲的芯片销售业绩，再创季度新高

2026-06-30

芯片巨头英伟达 (NVDA) 周三公布了创纪录的销售额和收入，这主要得益于数据中心计算需求的激增和人工智能代理的迅猛发展。截至 4 月份的季度，销售额达到 816 亿美元，比去年同期增长 85%，比 FactSet 调查的分析师预测的 789 亿美元高出 3.4%。该季度净利润为 583 亿美元，是去年同期的三倍多，比分析师预测的 429 亿美元高出 36.5%。“需求呈抛物线式增长，”首席执行官黄仁勋在与分析师的电话会议上表示。“原因很简单：智能体人工智能时代已经到来。”英伟达创纪录的销售额主要得益于其数据中心业务的增长，尤其是计算硬件的销售，包括公司的图形处理器（GPU）和其他芯片。网络硬件的销售额较去年同期增长了两倍，达到创纪录的 148 亿美元。该公司还宣布了两项有利于股东的举措：一项800亿美元的股票..

AI Agent

AI工作流

2026-06-26

Foreword 前段时间在 wolai 里把一套「一个人带 Agent 做产品」的流程摸清楚了，顺手画了一张图，又写了一份更偏团队协作的 Agent 方案。下文先展开独自开发（AIO）如何把产品、开发、测试、总负责人压缩成「你 + Agent」；再讲团队版（FTM）如何拆回四个岗位。文档怎么流转、人在哪几步必须插手、以及怎么把踩过的坑固化成 Skill，两家共用。 AIO，All-in-one FTM，Four man team 为什么要先定工作流 AI 写代码很快，快到你还没来得及想清楚需求，它已经给你造了三层抽象、两个 Design Pattern 和一个你根本没要的缓存层。没有流程约束，Agent 就像个热情过头的实习生：活干得猛，方向全靠猜，你没规范的内容往往走出了意想不到的呈现方式。所..

12 3…95