让我们开端构建一个 Hello World 的版本。我们将为神经收集供给一个显示有“Hello World!”的网页截图,并且练习它生查对应的标签。
起首,神经收集将图样映射成一组像素值列表。每个像素点有 RGB 三个通道,每个通道的值都在 0-255 之间。
为了让神经收集懂得这些标记,我应用了独热编码(one hot encoding)。是以“I can code”这一句就可以映射成:
上图中包含了开端和停止标签。这些标签控制着神经统??测的开端和停止时光。
2)神经收集将图片转化成 HTML 代码
对于输入数据,我们将用不合的句子,大年夜第一个单词开端,然后慢慢添加每个单词。输出的数据老是一个单词。
句子遵守与单词雷同的逻辑。它们也须要雷同的输入长度,然则在这里我们限制的是句子最大年夜的长度,而不是单词典数量。如不雅句子比最大年夜长度短,则用空词填充它,空词完全由零构成。
正如所看到的,单词都是大年夜右向左打印出来的。如许的话,每次练习都邑迫使每个单词改变本身的地位,如许模型就可以记住单词次序而不是每个单词典地位。
鄙人图中有四次猜测,每一行表示一次猜测。大年夜左边起,是以 RGB 通道表示的图像:红色、绿色和蓝色,还有之前提到过的单词。括号之外,是一个接一个的猜测,最后以红色方块停止。
如不雅你是刚接触深度进修的新手,建议你先大年夜概懂得下 Python,反向传播和卷积神经收集。
在 Hello World 版本中,我们用了三个记号:“start”、“Hello World!”和“end”。记号可所以任何器械,它可所以一个字符、单词或句子。固然应用字符记号须要更少的词汇量,但会限制神经收集。悼?辞号往往有最好的表示。