
我意思是,把我们很多 FAQ 问题和答案,以及更多的资料喂给 ChatGPT ,然后你去问 ChatGPT ,它就给你回复了
但我怎么把自己的那么多资料喂给 ChatGPT 呢?
总不能每次你问一次,我先把资料喂给 ChatGPT 一次吧?那多费劲,更何况 GPT-3.5 只能接受 3000 个 token 的输入,GPT-4 也只能接受 32000 个 token
1 malusama 2023 年 4 月 4 日 find tune |
2 Solix 2023 年 4 月 4 日 via iPhone 自己搭一个知识库,再结巴分词,再把问题根据相似度选择最相关的片段处理。 |
3 swulling 2023 年 4 月 4 日 via iPhone @malusama gpt 3.5 和 4 还没有开放 fine-tuning 的 API 用 https://platform.openai.com/docs/guides/embeddings 当然现在有很多成熟的库,比如 llama_index 和 langchain |
4 knightdf 2023 年 4 月 4 日 |
5 106npo 2023 年 4 月 4 日 via Android |
6 admin9 2023 年 4 月 4 日 内容数字化,使用 cosine similarity 算法找出跟问题最相关的内容,作为 prompt 传给 GPT https://github.com/openai/openai-cookbook/blob/main/examples/Question_answering_using_embeddings.ipynb |
7 RoshanWu 2023 年 4 月 4 日 |
8 fg990 2023 年 4 月 4 日 服务机器人是需求最明确。 |
9 lower 2023 年 4 月 4 日 chatgpt 肯定是希望其他的公司、产品、服务全都以插件的形式接入在它平台被集成和调用…… |
10 diehe 2023 年 4 月 4 日 @swulling llama_index 好像就是 chatindex ,langchain 这个我也关注到了,准备自己搭建一个玩玩。就是不知道,质量咋样! |
11 SmiteChow 2023 年 4 月 4 日 请参考 chatpdf.com |
12 aCodingCat 2023 年 4 月 4 日 我也有这个疑问 如果是聊天场景,难道用户每次发送,都要附带之前全量的聊天记录吗?那 token 岂不是很容易就爆了 |
13 duffercn 2023 年 4 月 4 日 via iPhone Embeddings |
14 alanhe421 2024 年 2 月 17 日 嗯 此类需要本质是拓展 AI 模型知识库,so ,embedding 合适 |