1. 多标签(multi_label)分类 * [深度学习模型处理多标签(multi_label)分类任务——keras实战](https://www.jianshu.com/p/76f9e4c0d0a2) * [NLP(二十八)多标签文本分类](https://www.cnblogs.com/jclian91/p/12671879.html) * [基于LSTM的中文文本多分类实战](https://blog.csdn.net/weixin_42608414/article/details/89856566) 2. 时间序列问题(单变量+多变量) * [如何开发 LSTM 模型进行时间序列预测](https://github.com/apachecn/ml-mastery-zh/blob/8d5c3c7672b574203cffef9b46e121e30d520ab5/docs/dl-ts/how-to-develop-lstm-models-for-time-series-forecasting.md) --- ## 【收集】实时流 - [flume+kafka+spark streaming+hdfs 整合项目](https://blog.csdn.net/qq_41562377/article/details/89603066) ## 【收集】数据采集 - 数据增强: 以防止过拟合,并提高模型的泛化能力 - <https://zhuanlan.zhihu.com/p/63182132> - <https://zhuanlan.zhihu.com/p/102640267> ## 【收集】特征工程 > 数据处理 在每个样本上减去数据的统计平均值可以移除共同的部分,凸显个体差异。 > 使用sklearn做单机特征工程 * https://www.cnblogs.com/jasonfreak/p/5448385.html > 特征工程系列 * 特征工程系列:特征筛选的原理与实现(上) * https://www.cnblogs.com/purple5252/p/11205500.html * 特征工程系列:特征筛选的原理与实现(下) * https://www.cnblogs.com/purple5252/p/11211083.html > 混淆矩阵及confusion_matrix函数的使用 * https://blog.csdn.net/u011734144/article/details/80277225 > sklearn 网格搜索 - 得到最优参数 * https://github.com/apachecn/ml-mastery-zh/blob/master/docs/xgboost/tune-number-size-decision-trees-xgboost-python.md
【收集】实时流
【收集】数据采集
【收集】特征工程
在每个样本上减去数据的统计平均值可以移除共同的部分,凸显个体差异。