学习日记
环境配置 镜像版本 minio/minio:RELEASE.2024-07-31T05-46-26Z 启动命令 docker compose 启动: ``` version: ‘2.0’ services: minio: image: ${MINIO_IMAGE} container_name: minio ports: ”${MINIO_PORT}:9000” 9001:9001 restart: always command: server /data –console-address “:9001” environment: MINIO_ACCESS_KEY: ${MINIO_ACCESS_KEY_ID} MINIO_SECRET_KEY: ${MINIO_SECRET_ACCESS_KEY} #大于等于8位 logging: options: max-size: “1024M” # 最大文件上传限制 max-file: “1000” driver: json-file volumes: ${DEPLOY_ROOT}/volumes/minio/data:/data networks: default_bridge
资料参考 https://js.design/special/article/collaborative-design.html https://godbasin.github.io/2020/10/10/why-spreadsheet-app-excited/
最近在看golang相关开发的框架,没有看到比较合适的,翻了翻相关的博客,找到了一些设计模式的内容,在这里记录一下,也谈一谈自己的看法。
参考论文:https://arxiv.org/abs/2210.03629 参考资料:https://www.promptingguide.ai/zh/techniques/react
这里我们使用的是QWen 2.0 模型,主要评估的两种方式是LoRA和PTuning。
Material Course: https://www.deeplearning.ai/short-courses/finetuning-large-language-models/
NL2SQL 是一个偏工业化的问题,SQL语句要是没有办法满足高准确率的话很难落地。目前也有很多解决方案去做这个事情,这里参考一些资料设计了一个通用的NL2SQL框架。
Triton Inference Server triton-inference-server服务常用于加速模型推理,是模型部署的关键服务。 triton 在部署的过程中可以部署多个模型,同时可以将多个模型进行串联,类似之前pipeline的形式,在triton中的定义叫做ensemble。
Function calling 让大模型具备了调用工具的能力,可以为传统的API工具进行赋能,以前的chat会先需要通过词槽的形式从用户的对话中收集相关的实体内容。
对话系统分为两种,一种是开放领域的对话机器人(chatbots),这种对话系统根据目标分为许多下游任务分支,例如在情感、社交方面;具备特定领域知识的行业bot,例如法律,医疗等,大模型的出现让这种chatbots的构建变得更加简单和智能。另外一种任务型对话机器人(task-oriented dialogue systems)则更加服务于特定任务,有非常明确的意图集合(intent set), 这个集合是close domain的,因此无法进行闲聊等偏离特定任务的对话。
旅行计划安排
ASR文本纠错实验
语义相似度的评估方法汇总