BLCL的博客小馆

归档 · 2022

首页

关于

归档

loading..
算法

layoutLM微调FUNSD数据集

引言对表单、合同、收据等信息抽取、理解,单从NLP角度来做就丧失了一些比较重要的特征,比如排版、位置、字体大小、字体颜色等特征。 如何引入这些特征对于关键信息抽取(Key Information Extraction)就比较重要。 此篇文章围绕FUNSD数据集来进行,尝试在不同的layoutLM模型上实现,以及对比各自的效果。 FUNSD数据集常见的数据集有FUNSD和XFUND,XFUND是一个融合了多语言的训练集,数据更为丰富。不过此处选择FUNSD来进行实验。 FUNSD全称为Form Understanding in Noisy Scanned Documents,直译过来就是嘈杂的扫描文档的表单理解,因为是扫描件,或多或少都会有些噪点的,也可看官网的描述。 数据集地址。 下载数据后,例如data..

更多

Jira里JQL实现查找上一个「工作日」的任务

厂里终于开始用笨拙的Jira了。总体用下来跟 Teambition 相比各有各的笨处。。。 默认的 board 过滤器有点不好用。本着为了stand-up meeting和周报快速检索上一个工作日和当周干了什么,找到一个 filter 写法: JQL过滤上一个工作日干了啥: (updatedDate < endofweek("-8d") AND updatedDate > startofday("-3d")) OR updatedDate > startofday("-1d") 这里不是简单的查昨天干了啥。比如周一需要看周五干了啥。所以有个 -8d 并 -3d 的神奇操作。具体的逻辑自己琢磨 过滤本周干了啥 updatedDate >= startOfWeek(0) Jira这..

更多

跟ChatGPT玩 20q 游戏

Q: can we play the 20q game? A: Sure, we can play the 20 Questions game! I'll think of an object, and you can try to guess what it is by asking up to 20 yes or no questions. Are you ready to begin? Q: yes. Is it a man? A: No, I'm sorry, but the object I am thinking of is not a man. You can ask another question to try to narrow down what the object might ..

更多
loading..
树莓派前端python

树莓派监控摄像头制作

前段时间买了台小主机,替换树莓派做云盘/下载器,也安装了jellyfin和aria2等其他自建服务,性能比树莓派强很多。于是树莓派又吃灰了,这次用它做个监控摄像头。 外观 外观 演示 制作 制作过程我没有记录下来,需要的物品如下: 树莓派 x1 树莓派专用摄像头 x1 MG995舵机(180度) x2 雪糕棍若干 热熔胶枪+热熔胶棒 5v电源+杜邦线若干 用外接电源给两个舵机供电,需要注意的是外接电源和树莓派必须共地,否则PWM不会起作用。两个舵机的信号线接树莓派gpio的第16和18个针。 代码 详细代码在Github仓库。前端用的react,后端是fasta..

更多
12