BLCL的博客小馆

归档 · 全部binance币安理财存U年化收益40% !!牛市躺着就是收钱,闲置资金记得放理财!立即注册立享收益!!

首页

关于

归档

loading..
算法

document-QA-layoutLMv2

介绍书接上文,layoutLM微调FUNSD数据集介绍了layoutlm和layoutxlm如何做named entity recognition,以及多模态-CLIP和多模态-字幕生成介绍多模态是如何融合的,本文继续基于layoutLM系列,基于huggingface document_question_answering来进行debug是如何实现的。 更新:针对layoutxlm在docvqa_zh上的训练代码已经放到document-qa啦。 原始数据在这之前,都是在介绍如何处理数据,也即如下代码: 123456789101112131415161718#from datasets import load_datasetdataset = load_dataset("nielsr/docvqa_12..

更多
loading..
Drone

无人机基础知识

Foreword 无人机的一些基础知识,特指四轴相关 结构 翼型 按照结构或者工作原理来区分 固定翼 多旋翼 四轴 六轴 八轴 直升机 伞翼、扑翼、飞艇 非常小众的机型 复合翼 四轴垂起固定翼 飞米的Manta,三轴和固定翼的混合机型,三轴垂起,机翼电机可倾转 构型 X型 控制复杂,但速度更快 +型 控制简单,但是速度慢,基本被淘汰了 H型 类似X,结构上中部吃力比较多 轴距 无人机轴距是指在无人机飞行中,机身前后两个旋翼电机轴之间的距离 不包含桨叶的长度 450 350/330 250 动力系统 螺旋桨 正桨,反桨,主要是为了抵消扭矩,克服自旋。正反是对旋转方向的描述,吹风都..

更多
stdout

VPS推荐:Hosteon

继续上次 Racknerd 之后发现这家还行。写了个爬虫扒了一下各色配置,独立服除外,有需要的自取 pid spec Disk Bandwidth Annual $ 1 1C512M 5GB 100Mbps $27.00 7 6C8G 100GB 100Mbps $270.00 77 1C1G 10GB 1Tbps $21.00 78 2C1.5G 20GB 2Tbps $36.00 79 2C2G 25GB 3Tbps $45.00 80 2C2.5G 30GB 4Tbps $54.00 81 3C3G 40GB 5Tbps $63.00 83 3C5G 50GB 8Tbps $90.00 84 6C10G 120GB 12Tbps $180.00 85..

更多
loading..
stdout

太阳系天体的 unicode 符号

发现Astronomical symbols,Planet symbols 及 Alchemical symbol IAU 七金 符号 名 name 星期 七曜 备注 金 ☉︎ 太阳 Sun 星期天 日曜 银 ☾ 月球 Moon 星期一 月曜 也可以画成 ☽︎ 或者月相 🌑︎🌒︎🌓︎🌔︎🌕︎🌖︎🌗︎🌘︎,🌚︎🌛︎︎🌝︎︎🌜︎︎ H 汞 ☿ 水星 Mercury 星期三 水曜 赫耳墨斯(Hermes),罗马人称 Mercury现代人称「爱马仕」的双盘蛇带翼权杖 Caduceus ☤ V 铜 ♀ 金星 Venus 星期五 金曜 维纳斯 E 🜨 地球 Earch Bible 里说的四条河把地球分成四洲另外的符号是 ♁ 表示十字架钉个球 glo..

更多
Git

一日一技:如何同时在多个分支写代码?

当我们在维护公司项目时,可能会遇到这样的场景:我正在开发一个新功能,突然需要修一个Bug。这个时候,有些同学是这样做的:12345678git add .git commit -m 'WIP'git checkout -b 新的分支名...新的代码修改完成并push以后...git checkout 老分支...继续开发...更有一些经验的同学,可能会这样写:12345git stashgit checkout -b 新的分支...新的代码修改完成并push以后...git checkout 老分支git stash pop但如果在修这个Bug的时候,又来了一个更紧急的Bug需要修怎么办?到后面很容易就把前面的代码搞忘了。其实我们有更好的办法,那就是使用git worktree命令。这个命令甚至可以让你同..

更多
loading..
Python

一日一技:警告但不禁止,遗留代码的优化策略

在之前的多篇文章中,我都反复告诫大家,不要滥用字典来传大量数据。因为当你的函数收到一个字典的时候,你根本不知道这个字典里面有哪些Key,你必须有一层一层往上看,找到所有尝试往字典里面添加新Key的地方,你才能知道它总共有哪些Key。但是,在正常公司项目中,我们可能会需要维护一些历史遗留代码。代码规模大,函数调用层级非常深。并且之前的人已经使用字典来传递了大量的数据。短时间内,我们没有办法直接把字典改成Dataclass。那么我们能做的,就是尽量避免后续的维护者往里面加入新的Key。我以前遇到过一个项目,它有一个字典,刚刚开始初始化的时候,只有5个Key。这个字典作为参数被传入了很多个函数,每个函数都会往它里面加很多个Key。到最后,这个字典里面已经有40多个Key了。对历史遗留代码的修改,必须要谨小慎微,..

更多
stdout

Getting started blogging on Win10

I am planning to setup by blogging environment on my Windows PC. OS: Windows 10 Shell: Bash on WSL1 Program: pelican on Miniconda3 with Python 3.11 My objective today is get rid of the static/js/core.js from aether-pelican theme and replace it with a simple CSS, and it turns out quite challenging. WSL1 and file system As it turns out, the installed Ubun..

更多
loading..
ChatGPT

老板让我加班怎么办?GPTs创建机器人实战

前两天的OpenAI发布会,相信很多同学看完以后都热血沸腾。我之前一直使用的是ChatGPT的免费版本,看完这个发布会以后,立刻就充值了ChatGPT Plus,来试一试这些高级功能。这两天GPTs功能上线了,短短三天时间,全球网友创建了几千个GPT机器人。我今天也来搞一个玩玩。使用GPTs创建机器人非常简单,不需要懂任何编程知识,甚至不需要懂Prompt工程,你只需要跟着他的向导,一步一步描述你的想法就可以了。当我们成为了ChatGPT Plus会员以后,在ChatGPT页面会看到一个Explore的栏目,如下图所示。进入这个栏目,点击Create a GPT就可以开始创建自己的机器人了。在左侧,是机器人创建向导,它会首先让你描述一下,你想实现什么功能。这个地方不需要懂Prompt工程,你只需要像平时说..

更多
PythonDocker

一日一技:如何安全运行别人上传的Python代码?

写后端的同学,有时候需要在网站上实现一个功能,让用户上传或者编写自己的Python代码。后端再运行这些代码。涉及到用户自己上传代码,我们第一个想到的问题,就是如何避免用户编写危险命令。如果用户的代码里面涉及到下面两行,在不做任何安全过滤的情况下,就会导致服务器的Home文件夹被清空。12import osos.system('rm -rf ~/*')有人想的比较简单,直接判断用户的代码里面有没有os.system、exec、subprocess……这些危险关键词不就可以了吗?这种想法乍看起来没有问题,但细想下,就会发现非常天真。如果用户的代码像下面这样写,你又要如何应对?123456789import requestscode = requests.get('https://www.kingname.in..

更多
loading..
stdout

火星上怎么结算工资

看到个段子 突然让我想起个事,如果去火星打工,薪资该怎么计算?摘录 wikipedia 火星的恒星时长 24小时37分钟22.663秒,而太阳日则长 24小时39分钟35.24409 秒。而地球的恒星时和太阳日则分别是 23小时56分钟4.0916秒 及 24小时。在比较之下,一火星太阳日等于1.027491地球太阳日,即比地球太阳日长2.7%。 怎么有两个天?继续搜 太阳日(英语:solar day)是依据太阳运动,所定义的时间,可以分为视觉太阳日和平均太阳日。一太阳日传统称为一“日”、一“天”或一“昼夜”。 英语里把火星的一天叫做一个 Sol。一个火星年在英文的 wikipedia 有讲 sidereal year ... is about 686.98 Earth solar days..

更多
1171819202180