Sunder

“后之视今，亦犹今之视昔”

如何在实际生产中使用预训练语言模型

以BERT为代表的预训练语言模型比“传统”的深度学习模型效果有明显的提升，并且BERT模型可以很容易的支持诸如分类、序列标注等常用NLP任务。但是预训练语言模型通常包含了数量巨大的参数，使得模型在实际生产环境中难以满足实时率的要求。我们在实践中采用模型蒸馏的方式来克服模型参数过大导...

Posted by Sunder on April 8, 2021

PolicyGradient

本文根据李宏毅老师视频整理而来。原理我们的目标是最大化期望的奖赏值\(\hat{R}\)。如果整个模型所有的参数用\(\theta\)来表示，那么我们训练的目标就是得到\(\theta^*=argmax_{\theta}\hat{R_{\theta}}\)。期望的奖赏值\(\hat{...

Posted by Sunder on December 26, 2017

Anaconda

注意！如果在安装Anaconda之前已经安装了pyenv，那么安装Anaconda之后pyenv会失效！安装方法在最后 cheat sheet Anaconda配置不同的python环境 Anaconda可以创建许多个python环境，每个环境拥有唯一的名字（需要你...

Posted by Sunder on December 16, 2017

Tensorflow矩阵变形

官方API tf.reshape # tensor 't' is [1, 2, 3, 4, 5, 6, 7, 8, 9] # tensor 't' has shape [9] reshape(t, [3, 3]) ==> [[1, 2, 3], ...

Posted by Sunder on August 28, 2017

Python Argparse

Python argparse用法标签（空格分隔）：未分类使用Python的argparse库，可以在命令行运行Python脚本时，很方便的传入参数。使用argparse大致分为一下几步： import argparse 创建一个parser 添加若干个参数（就...

Posted by Sunder on February 22, 2017

TFRecords指南

我们举例说明。在自然语言处理任务中，我们需要对句子进行分类。假设我们已经将句子表示成了词ID的形式，并且已经将类标转为了数字。也就是说每个句子表示成了一个k维的向量，其中k就是每个句子所包含的词的个数，这个向量的每一维都是一个整数。比如： k = 6 s1 = [9, 81, 32,...

Posted by Sunder on February 21, 2017

强化学习及深度强化学习图解

本文简要介绍强化学习的基本内容（图写的比较详细，后面可能会再补充一些文字） Q-learning 学习过程使用过程 DQN Overview 从状态s选择动作\(a_k\)，再获得奖励\(r_{s,a_k}\)和下一个状态\(s'\)，整个过程可以用元组\((s,a_...

Posted by Sunder on November 20, 2016

solr的简明使用

本文介绍solr的基本用法安装建议在linux环境下使用。到这里下载solr的最新版，比如solr-6.2.1.tgz。然后将其放置于任意目录，假设在 /home/user/ 目录中，然后将其解压。 tar zxf solr-6.2.1.tgz 其实这样就安装好了。但是s...

Posted by Sunder on October 19, 2016