FeatureEngineering-List
特征工程资料索引
-
2019-#Series#: 构建特征是一个很大的工程,总体来讲包括“特征选择”、“特征表达”和“特征评估”3 个部分。我们也按这 3 个部分,并结合自己的具体实践,用 3 篇文章来和大家聊一下特征工程的相关问题。
-
Faiss: A library for efficient similarity search and clustering of dense vectors.
-
2018-深度学习中常用的图像数据增强方法-纯干货: 本文将会带你学会如何对已有的图像数据进行数据增强,获取样本的多样性与数据的多样性从而为训练模型打下良好基础。
归一化与正则化
Dimension Reduction
-
2018-漫谈概率 PCA 和变分自编码器: 本文的主要目的就是整理一下 PCA、概率 PCA、AutoEncoders、变分 AutoEncoders 这四者的关系。
Feature Extraction
-
TSFresh :automatically calculate a huge number of time series characteristics, the so called features.
-
2019-The Hitchhiker’s Guide to Feature Extraction: Some Tricks and Code for Kaggle and Everyday work
频繁项挖掘
Time Series
-
Time Series Analysis in Python: An Introduction: Additive models for time series modeling.
-
2019-Time Series Prediction - A short introduction for pragmatists: This blog post will provide a comparison of the most prominent techniques and show you how to implement them.