
逻辑回归优化技巧总结(全)
2024/12/30
一、LR的特征生成 逻辑回归是简单的广义线性模型,模型的拟合能力很有限,无法学习到特征间交互的非线性信息:一个经典的示例是LR无法正确分类非线性的XOR数据,而通过引入非线性的特征(特征生成),可在更高维特征空间实现XOR线性可分,如...

机器学习数据不满足同分布,怎么整?
【日积月累】
机器学习作为一门科学,不可避免的是,科学本身是基于归纳得到经验总结,必然存在历史经验不适用未来的情况(科学必可证伪)。这里很应景地讲一个小故事--By 哲学家罗素: 农场有一群火鸡,农夫每天来给它们喂食。经过长期观察后,一只火...
2024/12/30

机器学习数据工程的概述
【AI驱动】
0 前言 吴恩达:过去十年,人工智能最大的转变是深度学习,而接下来的十年,我认为会转向以数据为中心Data-centric Artificial Intelligence(DCAI)。随着神经网络架构的成熟,对于许多实际...
2024/12/30

如何解释机器学习模型的决策?(Python)
【AI驱动】
机器学习模型变得越来越复杂和准确,但它们的不透明性仍然是一个重大挑战。理解为什么一个模型会做出特定的预测,对于建立信任和确保它按照预期行事至关重要(扩展阅读:机器学习模型可解释性的综述)。在本文中,我们将介绍LIME,并使用它来解释各种常见...
2024/12/30

11个机器学习的高级可视化图表
【AI驱动】
可视化对于理解复杂的数据模式和关系至关重要,它们在数据分析中发挥着至关重要的作用,提供了通常难以从原始数据或传统数字表示中辨别出来的见解。我们将介绍11个机器学习最重要和必须知道的图表,这些图表有助于揭示数据中的信息,使复杂数据更加可理解和...
2024/12/30

图神经网络(GNN)和神经网络的关系
【AI驱动】
1 介绍 深度神经网络由神经元组成,组织成层并相互连接,通过计算图捕捉其架构,其中神经元表示为节点,有向边连接不同层神经元。神经网络性能取决于其架构,但目前对神经网络精度与底层图结构之间的关系尚缺乏系统理解。这直接影响到设...
2024/12/30

挑战Transformer!Mamba的架构及实现(Pytorch)
【AI驱动】
Mamba一经出现就在人工智能界掀起波澜,被吹捧为Transformer的竞争对手。到底是什么让Mamba在拥挤的序列建模中脱颖而出? 今天我们来详细研究这篇论文《Mamba:具有选择性状态空间的线性时间序列建模》 在介绍之...
2024/12/30

Python数据挖掘算法入门与实践
【AI驱动】
一、数据挖掘简介 数据挖掘是一个通过对大量数据进行清理和处理,以发现其中隐藏的信息和模式的过程。简单来说,它是从大量数据中提取或“挖掘”知识的过程,也称为知识发现。 随着互联网和移动工具的发展,我们每天产生的数据量非常庞大,这些...
2024/12/30

系统总结!机器学习的模型!
【AI驱动】
一、有监督学习 有监督学习是机器学习中的一种重要方法,它利用带有专家标注的标签训练数据,学习从输入变量X到输出变量Y的函数映射。在这个过程中,每个输入样本都与一个相应的输出标签关联,通过这些关联的样本和标签,机器可以学习到输入和输出之...
2024/12/30

扩散模型的原理及实现(Pytorch)
【AI驱动】
上文我们介绍了OpenAI Sora 文生视频模型再次震撼了AI 圈,并提到了Sora模型实际上是一个扩散模型+Transformer,本文继续讲述扩散模型的发展、原理及代码实践。 扩散模型的导火索,是始于2020 年所提出的...
2024/12/30

Lag-Llama:时间序列大模型开源了!
【AI驱动】
之前我们介绍过TimeGPT,它是第一个时间序列的大模型,具有零样本推理、异常检测等能力。TimeGPT引发了对时间序列基础模型的更多研究,但是它是一个专有模型,只能通过API访问。 如今,终于出现一个用于时间序列预测的开源大模型:L...
2024/12/30

时间序列+Transformer!
【AI驱动】
1 介绍 Transformer在自然语言处理和计算机视觉领域表现优秀,但在时间序列预测方面不如线性模型。 将多个变量嵌入不可区分的通道并应用注意力时,性能和效率不如简单线性层,Transformer难以捕获多元相关性(图1)...
2024/12/30

深度!图解神经网络的数学原理
【AI驱动】
如今,熟练使用像 Keras、TensorFlow 或 PyTorch 之类的专用框架和高级程序库后,我们不用再经常费心考虑神经网络模型的大小,或者记住激活函数和导数的公式什么的。有了这些库和框架,我们创建一个神经网络,哪怕是架构很复杂的网...
2024/12/30

扩散模型+知识图谱的前沿综述
【AI驱动】
知识图谱(图网络)在推荐系统中的重要性不言而喻,但并非所有关系都与目标推荐任务相关。为解决这一问题,本文介绍了名为DiffKG的新的知识图谱扩散模型,结合了生成扩散模型与数据增强范式,实现了鲁棒的知识图谱表示学习。 1 介绍 ...
2024/12/30

一文彻底搞懂深度学习 – 多头注意力(Multi-Head Attention)
【AI驱动】
在深度学习中,多头注意力(Multi-Head Attention)是一种注意力机制。它是对传统注意力机制的一种改进,旨在通过分割输入特征为多个“头部”(head)并独立处理每个头部来提高模型的表达能力和学习能力。 多头注意力...
2024/12/30

时间序列预测的系统总结
【AI驱动】
时间序列预测是我们实际项目场景中经常碰到的一类主题。在这篇文章里简单介绍一下我们观远在时序问题上的一些探索和心得体会。 时序问题的定义和分类 顾名思义,时间序列指的是按照时间顺序先后发生的数据序列,在此基础上,我们会对这个序列做...
2024/12/30
搜索文章
热门话题
文章精选