2019/11/17
Nov 17, 2019
0 写在前面
有段时间没有更新博客了,这篇其实是今年9月自己在一次组会上展示的内容,自我感觉做的还可以,因此与大家分享一下。本文中的一些见解可能不够严谨,对于理解不对的地方请不吝赐教。
1 当我们谈优化时,我们谈些什么
提到优化,我的脑海里最先想起的,便是Stanford CS231n的Sl...
A walkthrough of classic and modern deep learning optimizers — SGD, Momentum, AdaGrad, RMSProp, Adam, RAdam, LookAhead, and the Ranger combo — with intuition...
阅读更多
2019/08/05
Aug 5, 2019
写在前面
之前写了一篇 Scrapy 爬取网易新闻的博客,提到下次要尝试图片爬虫,于是,这篇博客诞生啦!(我怎么会鸽呢对不对)
事实上,对于网络爬虫,爬取图片和爬取文本大同小异,其思路大致都是:获取网页 -> 从网页中提取有用信息 -> 存储和进一步爬取。这次,我们要从网页中提取的信...
A hands-on Scrapy tutorial crawling an image gallery site — defining Items, writing spider logic, implementing ImagesPipeline, handling hotlink protection, a...
阅读更多
2019/07/12
Jul 12, 2019
Summer School半程总结
今天是7月12日,研究生新生暑期学校第二周的星期五。再过一周,大学本科的最后一个暑假就要来了。
暑期学校选了两门课,“Information Retrieval & Information Extraction” 和 “R and Data Mini...
A mid-summer-school reflection: on the courses I took, the flags I planted for the long break ahead, and doing things for yourself.
阅读更多
2019/07/10
Jul 10, 2019
写在前面
最近在暑期学校选的一门课需要从网上爬取文本数据,借此机会复习一下 Python 网络爬虫~
使用的是自己之前用过的 Scrapy 框架,以下是这次自己的学习 & 动手过程。
1 复习时间
网络爬虫介绍
在介绍框架之前,简单介绍一下网络爬虫(Web Crawl...
Building a news crawler with Scrapy — from basic CrawlSpider setup to reverse-engineering a news API when JavaScript-rendered pages block static scraping.
阅读更多
2019/05/04
May 4, 2019
What is zsh?
Shell 的类型有很多种,例如 Linux 和 MacOS 下默认的是 Bash。虽然 Bash 的功能已经足够完备,但对于以懒惰为美德的程序员来说,其提示功能不够强大,界面也不够酷(zhuang)炫(bi)。
而 zsh 作为 Shell 的一种,功能极其强大,但因...
oh-my-zsh makes zsh actually usable — here's how to install it, add syntax highlighting and autosuggestions, and pick a clean theme.
阅读更多
2019/04/16
Apr 16, 2019
因为毕设涉及到截取视频帧这一操作,因此(在学长的推荐下)接触并使用了 ffmpeg 这个转码视频的强大工具。
1 What is ffmpeg?
ffmpeg 是一个非常有用的命令行程序,用于快速转码媒体文件。它是领先的多媒体框架 FFmpeg 的一部分,后者在其官网是这么介绍的:”(FFmpe...
A practical guide to ffmpeg — extracting frames from video and clipping clips, with real examples from my own workflow.
阅读更多
2019/01/17
Jan 17, 2019
0 前言
之所以会写这篇教程,是因为发生了黑客攻击我的博客并删除数据库的事件,导致我一怒之下直接重装了服务器的系统。。。
所以,我要首先对攻击我的服务器的黑客献上最崇高的敬意:
1 准备工作
为了搭建一个完全属于自己的个人博客,你只需要以下 3 样东西:
自己有...
Step-by-step: domain setup, LNMP stack install, WordPress deployment on a VPS. Written after a hacker wiped my database.
阅读更多