大模型
大模型
简介
大语言模型(large language model,LLM) 是一种语言模型,由具有许多参数(通常数十亿个权重或更多)的人工神经网络组成,使用自监督学习或半监督学习对大量未标记文本进行训练。
相关项目
LongChain
项目地址:LongChain
LangChain 是一个用于开发由语言模型驱动的应用程序的框架。它使应用程序能够:
感知上下文:将语言模型连接到上下文源(提示指令、少量镜头示例、内容以使其响应为基础等)
理解原因:依靠语言模型进行推理(关于如何根据提供的上下文回答、采取什么行动等)
此框架还提供了网页和插件规范。
Text generation web UI
此项目可以在本地搭建一个聊天服务器,并且可以替换各种模型
Tabby
项目地址:Tabby
此项目可以在本地搭建一个代码提示服务器,并且可以使用不同参数的 CodeLama 和 StarCoder 等模型。
注:目前已有 VS Code,IntelliJ Platform 和 VIM 的支持插件。
Continue
项目地址:Continue
使用 Continue 可以让 Ollama 和 IDE 结合起来。
注:具体配置参见 An entirely open-source AI code assistant inside your editor 博客。
环境准备
PyTorch
使用如下命令即可安装 PyTorch
1 |
|
使用如下脚本可以监测默认设备
1 |
|
大模型
https://wangqian0306.github.io/2023/ai/