Jiayue Cai's Blog

Know more, Do more, Be more

Python大文件处理

For Data Mining

Last updated on 2019-3-21… 基础知识 进程与线程 进程在执行过程中拥有独立的内存单元,而多个线程共享内存。 进程切换时,耗费资源较大,效率要差一些。对于一些要求同时进行并且又要共享某些变量的并发操作,只能用线程,不能用进程。 一个程序至少有一个进程,一个进程可以有多个线程。 Python多线程 Python中的多线程是假的多线...

Attention机制

Self-Attention、Multi-Head Attention、Transformer、Position Embedding

Last updated on 2019-11-8… 《细讲Attention Is All You Need》、《Attention is All You Need》浅读(简介+代码)、Self-Attention与Transformer、【NLP】Transformer详解 前言 Attention机制最早是在视觉图像领域提出来的(上世纪90年代),但是真正热门起来...

代价函数

Cost Function

Last updated on 2019-4-11… Cost Function和Loss Function的区别: Cost Function:指基于参数w和b,在所有训练样本上的总成本 Loss Function:指单个训练样本的损失函数 各种概率分布 均方误差 MSE 假设是高斯分布,又名正态分布 均方误差的含义是求一个batch中n个...

机器学习知识整理

For 面试

Last updated on 2019-11-8… 相关资源整理 基础:线性代数、概率统计、优化 part1、优化 part2、信息论及其他 学习:ML整理1、ML整理2、ML算法、ML面试 笔记:斯坦福ML笔记、吴恩达ML、吴恩达DL 代码:李航ML、DL 判别式与生成式 分类与回归 参考链接、12种回归算法 回归与分类的根本区别在于输出空间是否...

C++动态规划题型

For 笔试

Last updated on 2019-10-11… 动态规划求解的一般思路: 判断问题的子结构,当具有最优子结构时,动态规划可能适用。 求解重叠子问题。一个递归算法不断地调用同一问题,递归可以转化为查表从而利用子问题的解。(分治法则不同,每次递归都产生新的问题。) 重新构造一个最优解。 01背包问题 有 n 个重量个价值分别为 w<sub>i&l...

C++字符串题型

For 笔试

Last updated on 2019-10-4… 字符串常用技巧: 查找表:标记字符最新的位置 int table[256]={0}; table[s[i]] = i; 标记各单词中字符出现位置 vector<vector> pos(128) 滑动窗口 if(i>=l1) c2[s2[i-l1]-‘a’]–; memcmp(c1,c2,sizeo...

C++排序算法

For 笔试

Last updated on 2019-10-4… 总览 关于稳定性(简单说就是两个相等的元素,排序前后相对位置不变) 稳定的排序算法:冒泡排序、插入排序、归并排序和基数排序; 不是稳定的排序算法:选择排序、快速排序、希尔排序、堆排序。 参考链接 冒泡排序 冒泡排序是最简单粗暴的排序方法之一。它的原理很简单,每次从左到右两两比较,把大的交换到后面...

C++二叉树

For 笔试

Last updated on 2019-10-4… 直观理解二叉树遍历 定义与创建 #include <iostream> #include <string> #include <queue> #include <stack> using namespace std; string str; int i; struc...

C++刷题注记

For 笔试

Last updated on 2019-10-4… 基础练习题、B站up讲解视频 #include <bits/stdc++.h> using namespace std; 常用技巧整理 字符串 查找表:标记字符最新的位置 int table[256]={0}; table[s[i]] = i; 标记各单词中字符出现位置 vector<...

基于深度学习的推荐系统综述

Focus on deep learning

Last updated on 2018-8-9… 本文是对发表在ACM 2017的《Deep Learning based Recommender System: A Survey and New Perspectives》一文的笔记,作梳理用。 》原文链接 数据集和评估指标 常用数据集:Movielens、Netflix、Amazon、Yelp、CiteUlike 评估指标...