【收集】比赛项目+特征工程

1.  多标签（multi_label）分类

* [深度学习模型处理多标签（multi_label）分类任务——keras实战](https://www.jianshu.com/p/76f9e4c0d0a2)
* [NLP（二十八）多标签文本分类](https://www.cnblogs.com/jclian91/p/12671879.html)
* [基于LSTM的中文文本多分类实战](https://blog.csdn.net/weixin_42608414/article/details/89856566)

2. 时间序列问题（单变量+多变量）

* [如何开发 LSTM 模型进行时间序列预测](https://github.com/apachecn/ml-mastery-zh/blob/8d5c3c7672b574203cffef9b46e121e30d520ab5/docs/dl-ts/how-to-develop-lstm-models-for-time-series-forecasting.md)

---

## 【收集】实时流

- [flume+kafka+spark streaming+hdfs 整合项目](https://blog.csdn.net/qq_41562377/article/details/89603066)

## 【收集】数据采集

- 数据增强： 以防止过拟合，并提高模型的泛化能力
    - <https://zhuanlan.zhihu.com/p/63182132> 
    - <https://zhuanlan.zhihu.com/p/102640267>

## 【收集】特征工程

> 数据处理

在每个样本上减去数据的统计平均值可以移除共同的部分，凸显个体差异。

> 使用sklearn做单机特征工程

* https://www.cnblogs.com/jasonfreak/p/5448385.html

> 特征工程系列

* 特征工程系列：特征筛选的原理与实现（上）
* https://www.cnblogs.com/purple5252/p/11205500.html
* 特征工程系列：特征筛选的原理与实现（下）
* https://www.cnblogs.com/purple5252/p/11211083.html

> 混淆矩阵及confusion_matrix函数的使用

* https://blog.csdn.net/u011734144/article/details/80277225

> sklearn 网格搜索 - 得到最优参数

* https://github.com/apachecn/ml-mastery-zh/blob/master/docs/xgboost/tune-number-size-decision-trees-xgboost-python.md




Provide feedback

Saved searches

Use saved searches to filter your results more quickly

【收集】比赛项目+特征工程 #343

【收集】实时流

【收集】数据采集

【收集】特征工程

Metadata

Assignees

Labels

Type

Projects

Milestone

Relationships

Development

【收集】比赛项目+特征工程 #343

Description

【收集】实时流

【收集】数据采集

【收集】特征工程

Metadata

Metadata

Assignees

Labels

Type

Projects

Milestone

Relationships

Development

Issue actions