AI | cubxxw - 第 3 页

2024年1月6日大语言模型分享会模型的局限：深度学习预训练模型大语言模型大语言模型的涌现能力： 💡 复杂系统学科里已经对涌现现象做过很久的相关研究。那么，什么是“涌现现象”？当一个复杂系统由很多微小个体构成，这些微小个体凑到一起，相互作用，当数量足够多时，在宏观层面上展现出微观个体无法解释的特殊现象，就可以称之为“涌现现象” Link: 大语言模型进化之谜：涌现现象的挑战与争议_AI_张俊林_InfoQ精选文章大语言模型的特点趋势的转变：大语言比人更懂人类的习惯。使用 RLHF 训练使用人类习惯的方式交互大语言模型的发展脉络：开源模型越来越多，比例越来越大。预训练模型依旧是非常多的，但是微调的比例越来越高如何学习大语言模型模型结构的配置大语言模型的微调使用技巧自己训练模型不一定要只是单一的数据，也可以是数据的混合（包括自己提供的业务文档或者代码）训练的数据来源： 💡 数据安全和重复数据的去重，数据筛选很重要（这一步该怎么做？）当处理和准备用于机器学习模型训练的数据时，确保数据的质量、安全性、和去重非常重要。这里有一些关键步骤和方法，可以帮助你实现这一目标：质量过滤（Quality Filtering）: 确保数据准确无误：移除或修正任何错误的、不完整的或者是不准确的数据。保证数据的一致性：确保所有的数据遵循同样的格式和标准。数据去重（Data Deduplication）: 识别和移除重复数据：使用算法或者工具来识别完全相同或高度相似的数据项，并将其合并或删除。对于文本数据，可以使用哈希算法或者基于内容的去重方法。隐私去除（Privacy Removal）: 确保数据中不含有任何个人可识别信息（PII），如姓名、地址、电话号码等。在某些情况下，可以使用数据脱敏技术，如匿名化或伪匿名化，来保护用户隐私。分词（Tokenization）: 对于文本数据，分词是将连续文本分割成更小单元（如单词、短语或字符）的过程。分词的方法依赖于特定语言的语法和词汇结构。对于中文，可能需要特定的分词工具，因为中文是一个无空格分隔的语言。解码器结构 “causal decoder"和"prefix decoder"是两种不同的解码器结构，它们在处理序列数据，尤其是在文本生成任务中扮演着重要角色。下面是这两种解码器的对比： Causal Decoder (因果解码器) 定义和应用: 因果解码器，如在GPT系列模型中所使用的，是一种单向解码器。它在生成文本时，仅考虑已经生成的或给定的前文（即，它只看到左侧的上下文）。工作原理: 在处理每个新词时，因果解码器仅使用前面的词作为上下文。这种模式模拟了人类自然语言的生成方式，即基于已知信息顺序地产生新信息。用途: 适用于文本生成任务，如故事叙述、自动写作、聊天机器人等。特点: 保证了生成的文本是连贯的，并且在逻辑上遵循了之前的上下文。不能回看或考虑未来的词汇或句子结构。 Prefix Decoder (前缀解码器) 定义和应用: 前缀解码器是一种可以同时考虑前文和后文的解码器，类似于BERT中的masked language model（MLM）。它在处理数据时，可以同时考虑序列中的前缀和后缀信息。工作原理: 在处理每个词时，前缀解码器使用前面的词和后面的一些占位符或掩码作为上下文。这种方式使得解码器在生成某个词时，可以考虑到整个序列的结构。用途: 常用于需要双向上下文理解的任务，如文本填空、句子完善、语言模型训练等。特点: 能够在生成文本时考虑到更全面的上下文信息。更适合于理解整个句子或段落的结构和含义。模型结构的优化模型结构优化一直以来都是比较fancy的工作，优秀的模型结构设计，可以大大提高模型参数的效率，甚至小模型效果可以超过大模型。本文我们以XLNet、ALBERT、ELECTRA为例进行分析。虽然他们也可以认为是预训练任务优化和模型轻量化方面的工作，但鉴于模型结构创新力度很大，我们还是在模型结构优化这个版块来分析他们。 ...

前言 🔮 在我的 Slack 工作区中，集成了多个 AI，分别有 ChatGPT 4、ChatGPT 3.5、Claude …… 我们可以通过 Slack 免费并且无限制的和 AI 交互，欢迎大家加入到 Slack，这里是链接： https://join.slack.com/t/kubecub/shared_invite/zt-1se0k2bae-lkYzz0_T~BYh3rjkvlcUqQ 介绍很早之前就了解到了 Auto-GPT，作为 GitHub 上近期增长速度最快的项目（没有之一），Auto-GPT 在开源社区可谓是人尽皆知，甚至 star 已经很快就超过 Kubernetes，目前有 125k star。得益于 Auto-GPT 的出色技术，可以高精度和高效率地自动执行许多任务。它利用了 GPT-4 强大的自然语言处理功能。我们甚至可以通过它来实现更多的自动化的工作，比如说前一节在 Sealos 上开发一款 AI 自动云原生化项目自动上线工具什么是 AutoGPT 它的 GitHub 地址： GitHub 从本质上讲，Auto-GPT 利用 OpenAI 最新人工智能模型的多功能性与软件和服务进行在线互动，使其能够 “自主 “执行X和Y等任务。但正如我们在大型语言模型方面的学习，这种能力似乎像海洋一样宽广，但却像水坑一样深。 AutoGPT 是一个由人工智能驱动的应用程序，利用 GPT-4 等 LLM 的强大功能自主创建和处理各种工作。通过使用 Auto GPT，组织和个人可以简化报告创作、内容创建和数据分析等流程，以节省时间并减少错误。 AutoGPT 改变了任务自动化的游戏规则，使组织和个人能够专注于其他关键任务，同时将重复和琐碎的工作留给程序。随着 LLM 的不断发展，我们可以期待看到像 Auto GPT 这样功能越来越强大的软件能够执行越来越复杂的任务。 ...

AI

AI元年: 2024年的新兴挑战与趋势

如何安装和使用自主人工智能工具Auto-GPT

在档案中寻找智慧…