Kubernetes的安装和使用(一)
k8s是一种可以实现容器集群的自动化部署、自动扩缩容、维护等功能的服务。Docker解决了应用运行时环境的问题,而k8s则可以用来构建大量应用服务,它能方便的管理海量应用容器。它拥有自动包装、自我修复、横向缩放、服务发现、负载均衡、自动部署、升级回滚、存储编排等特性。k8s的节点分为master和node,它的架构如下Master:官方叫做控制平面(Control Plane),它用于负责整个集群的管控。master由4个部分组成API Server进程,负责任何资源的管理和操作etcd,用于保存集群状态,只有apiServer可以读写调度器(Scheduler),用于调度Pod资源控制器管理器(kube-controller-manager)Node:数据平面,是实际的工作节点,直接负责对容器的资源控制..
更多DALL·E入门
Foreword DALL·E-3 由于GPT的强势,其理解能力大幅提升,绘画能力进步神速 DALLE 完整图片 出错 在画下面这副图时出现了错误 简单的纠正,继续出错 再次纠正,正确了 Summary DALL·E 3 确实很不错 Quote https://zhuanlan.zhihu.com/p/669649442
更多Prompt入门指南
Foreword Prompt的入门指南,简单使用 Prompt Engineering是一种在自然语言处理领域的技术,它通过设计、优化和评估输入提示(prompt)来引导大规模语言模型(如GPT系列模型)生成期望的输出。简而言之,Prompt Engineering就是找到最佳方式向模型提问,以获得最有用、最准确的回答 Prompt Prompt,就是如何让AI按照你的设想去完成你的目标 我们一般将给大模型的输入称为 Prompt,将大模型返回的输出称为 Completion,让大模型帮我们做补全 角色扮演 角色:描述LLM在这里扮演的角色是什么样的,核心就是给出来问题的背景信息和约束 问题描述:说清楚要处理的是什么问题 输入描述:给出具体输入给大模型的数据或者命令是什么样的 输出描..
更多一日一测:Bright Data的海外代理测试
上周的公众号文章提到了Bright Data提供的代理服务。没想到他们的运营同学竟然找上了门,问我能不能帮他们做一个评测。我之前使用Bright Data的代理,是因为突然有一天我的HuggingFace爬虫挂了。比较奇怪的是,这个爬虫在我电脑上始终正常运行,但一放到服务器上就请求失败。联想到HuggingFace被封了,而这个爬虫之前一直使用的国内代理供应商,那么原因就很明显了。因为我的电脑是24小时挂着梯子的,所以能够正常访问HuggineFace,但爬虫部署到服务器上面以后,他会自动使用配置好的国内代理。由于国内代理也受到GFW的影响,因此也会出问题。首先看一下Bright Data他们代理的基本功能,基于数据中心的隧道代理和基于住宅IP的隧道代理还有基于Sim卡的隧道代理。海外代理都是按流量收费的..
更多qwen1.8B试玩
介绍阿里出了个qwen1.8B,对于资源有所要求的场景或者需要支持长文本的场景,应该是目前国内在这个量级内最优的选择了吧。接下来以此来打通微调、部署各个流程,算是一次记录。 微调首先按照要求和快速使用来跑起来,安装flash-attn,先跑下推理,正常,接下来就进入微调阶段。 按照微调流程,这里采用LoRA进行微调,但是需要注意的是,虽然官方给出了显存占用及训练速度,但是我在1080Ti上得到的显存占用还是要更高一些,大家可以将这个指标理解成为运行起来至少需要的显存,在进行训练时,还是会有一些增高。 训练的话采用finetune_lora_single_gpu.sh默认配置,幸亏我没有采用train,而是使用了dev数据集,7500条数据,8个多小时,,不过整个loss还是蛮正常的,没有出现issue里出..
更多Copilot单账号共享合租服务
Foreword 同ChatGPT,一个账号的Copilot分享给多人使用。默认Copilot单账号可以多端不同时使用,大概是3-4端没明显问题的。 由于通过某些渠道可以让Copilot直接访问到ChatGPT4,而Copilot只需要10刀,比直接买ChatGPT Plus便宜多了,就让很多人动起了Copilot转发到GPT的心思,这也导致了很多账号被彻底封禁。我这里不适用任何转发,只是单纯的作为代码辅助工具使用。 Copilot账号在开启时,建议关闭代码分享,否则可能涉及泄密等严重的问题 CoCopilot https://cocopilot.org/dash CoCopilot可以把原本的Copilot的账号分享给大概10个人左右的小团队使用而无需额外的操作。CoCopilot提..
更多ChatGPT Plus 单账号共享合租服务
Foreword 单个ChatGPT Plus 账号共享合租,各自会话独立分割,就好像一个人使用一样,方便给一个组织或者多人使用。 CWS 源于chatgpt-web-share项目,适用于个人、组织或团队的 ChatGPT 共享方案。共享一个 ChatGPT Plus 账号给多人使用,提供完善的管理和限制功能。 https://github.com/chatpire/chatgpt-web-share 部署 新建目录 cd ~ mkdir cws && cd cws mkdir -p data/config 配置初始密码 export MONGODB_PASSWORD=password # MongoDB 密码 export INITIAL_ADMIN_PA..
更多Git 连接多个远程仓库
有时候我们可能会需要 push 到多个远程仓库,比如同时链接多个代码托管平台的账号,那么可以参考本文所述的方法配置。 保险起见在操作之前请先做好备份工作,毕竟数据无价。 方法 1 - 添加多个远程仓库比如要链接两个 Github 仓库,分别是 github1 和 github2,那么: 1234567891011121314151617# 添加 github1git remote add github1 https://github.com/username/github1.git# 添加 github2git remote add github2 https://github.com/username/github2.git# 提交到 github1git push github1 master# ..
更多nodejs stream to buffer
/** * * @param {ReadableStream} stream */ async function streamToBuffer(stream) { return new Promise((resolve, reject) => { const buffers = []; stream.on('data', (chunk) => { buffers.push(chunk); }); stream.on('end', () => { resolve(Buffer.concat(buffers)) }) stream.on('error', (error) => { re..
更多一日一技:自动提取任意信息的通用爬虫
使用过GNE的同学都知道,GNE虽然是通用爬虫,但只是文章类页面的通用爬虫。如果一个页面不是文章页,那么就无能为力了。随着ChatGPT引领的大语言模型时代到来,这个问题基本上已经不是问题了。我们先来看一个效果。首先打开Linkedin,随便找一个招聘的岗位,如下图所示:然后,我们直接使用GPT从这里提取信息:对应的Prompt为:12345你是一个数据提取小助手,能够从一大段招聘相关的文本中提取有用的信息并以JSON格式返回。{经过清洗的网页源代码或者文本}请从上面的文本中,提取招聘相关的信息,返回数据格式如下: {"title": "岗位名称", "full_time": "是否为全职", "employee_num": "雇员数量", "level": "岗位等级", "skill": "岗位需要的..
更多