Sunder


“后之视今,亦犹今之视昔”

如何在实际生产中使用预训练语言模型

以BERT为代表的预训练语言模型比“传统”的深度学习模型效果有明显的提升,并且BERT模型可以很容易的支持诸如分类、序列标注等常用NLP任务。 但是预训练语言模型通常包含了数量巨大的参数,使得模型在实际生产环境中难以满足实时率的要求。 我们在实践中采用模型蒸馏的方式来克服模型参数过大导...

PolicyGradient

本文根据李宏毅老师视频整理而来。 原理 我们的目标是最大化期望的奖赏值\(\hat{R}\)。如果整个模型所有的参数用\(\theta\)来表示,那么我们训练的目标就是得到\(\theta^*=argmax_{\theta}\hat{R_{\theta}}\)。 期望的奖赏值\(\hat{...

Anaconda

注意!如果在安装Anaconda之前已经安装了pyenv,那么安装Anaconda之后pyenv会失效! 安装方法在最后 cheat sheet Anaconda配置不同的python环境 Anaconda可以创建许多个python环境,每个环境拥有唯一的名字(需要你...

Tensorflow矩阵变形

官方API tf.reshape # tensor 't' is [1, 2, 3, 4, 5, 6, 7, 8, 9] # tensor 't' has shape [9] reshape(t, [3, 3]) ==> [[1, 2, 3], ...

Python Argparse

Python argparse用法 标签(空格分隔): 未分类 使用Python的argparse库,可以在命令行运行Python脚本时,很方便的传入参数。 使用argparse大致分为一下几步: import argparse 创建一个parser 添加若干个参数(就...

TFRecords指南

我们举例说明。 在自然语言处理任务中,我们需要对句子进行分类。 假设我们已经将句子表示成了词ID的形式,并且已经将类标转为了数字。也就是说每个句子表示成了一个k维的向量,其中k就是每个句子所包含的词的个数,这个向量的每一维都是一个整数。比如: k = 6 s1 = [9, 81, 32,...

强化学习及深度强化学习图解

本文简要介绍强化学习的基本内容(图写的比较详细,后面可能会再补充一些文字) Q-learning 学习过程 使用过程 DQN Overview 从状态s选择动作\(a_k\),再获得奖励\(r_{s,a_k}\)和下一个状态\(s'\),整个过程可以用元组\((s,a_...

solr的简明使用

本文介绍solr的基本用法 安装 建议在linux环境下使用。 到这里下载solr的最新版,比如solr-6.2.1.tgz。 然后将其放置于任意目录,假设在 /home/user/ 目录中,然后将其解压。 tar zxf solr-6.2.1.tgz 其实这样就安装好了。但是s...