Jiayue Cai's Blog

Know more, Do more, Be more

Python特征选择篇

For Data Mining

Last updated on 2020-3-12… python语句 pandas常用函数、pandas文档 pygal通用画图 networkx社会网络图 pyecharts地理地图、pyecharts示例、国家名称 本篇是上一篇《python特征工程篇》的一个子集,由于内容较多而单独出一篇。(»原文链接) 特征选择 特征选择是特征工程里的一个重要...

Python特征工程篇

For Data Mining

Last updated on 2020-11-1… python语句 pandas常用函数、pandas文档 pygal通用画图 networkx社会网络图 pyecharts地理地图、pyecharts示例 特征工程是对原始数据进行一系列处理,将其提炼为模型可理解的输入数据格式,为模型提供信息增益以提升模型精度,特征工程是一个表示和展现信息的过程。 在...

XGBoost推导

决策树的boosting模型

仅主要知识点梳理 引言 XGBoost的全称 eXtreme Gradient Boosting,2014年2月诞生的专注于梯度提升算法的机器学习函数库,作者为华盛顿大学研究机器学习的大牛——陈天奇。他在研究中深深的体会到现有库的计算速度和精度问题,为此而着手搭建完成 xgboost 项目。xgboost问世后,因其优良的学习效果以及高效的训练速度而获得广泛的关注,并在各种算法大...

集成学习简要

简略图

Last updated on 2018-7-20… 集成方法是由多个较弱的模型集成模型组,一般的弱分类器可以是DT, SVM, NN, KNN等构成。 其中的模型可以单独进行训练,并且它们的预测能以某种方式结合起来去做出一个总体预测。 该算法主要的问题是要找出哪些较弱的模型可以结合起来,以及如何结合的方法。 Bagging(划分数据子集并行)例如Random forest ...

Numpy学习

For python

Last updated on 2017-11-26… 基本 import numpy as np 生成 x = np.empty([3,2], dtype = int) # [[0, 0],[0, 0],[0, 0]] x = np.zeros((5,), dtype = np.int) # [0 0 0 0 0] x = np.ones(5) ...

Gitalk “Validation Failed” 解决办法

博客插件

Last updated on 2018-12-07… 错误原因 Gitalk使用 window.location.pathname 创建 Issue 的 Tag,而而Github在今年更新了关于Issue的字数限制(50字)。 博客名超过4个中文字就出现Validation Failed。 解决思路 使用一个MD5工具,将location.pathname长度缩短。 具...

网络传播仿真

My Graduation Project

Search Design Test Conclusion 本文针对舆情演化的规律进行研究,综合集成Agent建模、复杂网络和舆情动力学三者的优点,理论上提出了基于多Agent复杂网络的舆情演化模型框架。同时,基于NetLogo平台,实现了该模型的原型系统,并应用原型系统进行仿真实验,研究了影响网络舆情演化的一些主体因素: 领域相关度、坚持度、...

C++&Java&Python对比

语法

Last updated on 2016-11-13… 总览 数组 动态数组 哈希表 优先队列/堆

web开发笔记

来自纸质的笔记本

Last updated on 2020-6-24… 很早很早之前的笔记,来自多页的内容,汇总到这篇,所以写的会很乱… 最早之前学开发的时候,只在微博和csdn上写过寥寥几篇,但并没有养成写博客习惯。 后来想做一些回顾的时候,最终还是发现纸质笔记没有博客来的实用,于是就从此开始督促自己养成写博客的习惯。 MVC框架 用户首先在界面中进行人机交互,然后请求发送到控制器...

Git指令整理

常用指令

随便整理的一些自用的Git指令 本篇转载自qiubaiyang GitHub创建仓库提示代码 echo "# 项目名" >> README.md git init git add README.md git commit -m "first commit" git remote add origin git@github.com:qiubaiying/项目名...