
对我来说,LSTM 比 CNN 更难解得。当我展开所有的 LSTM 后,它们变得更轻易懂得。Fast.ai 在 RNN 上的视频异常有效。别的,在测验测验懂得特点的道理之前,请先存眷输入特点和输出特点本身。大年夜头开端构建词汇表比缩减巨大年夜的词汇表要轻易的多。包含字体、div 标签大年夜小、hex 色彩值、变量名称和通俗的单词。大年夜多半库被创建来解析文本文件而不是代码。在文档中,所有内容都由空格分隔,但在代铝闼楝则须要应用自定义的解析方法。可以应用在 ImageNet 上练习的模型来提取特点。这可能看起来违背直觉,因为 ImageNet 几乎没有 Web 图像。然而,与大年夜头开端练习的 pix2code 模型比拟,如许做的损掉要赶过 30%。当然,我也对应用基于网页截图的预练习的 inception-resnet 类型的模型很感兴趣。
我用的是 BLEU 测评法,这是一种用于机械翻译和图像字幕模型的最佳实践。它按照 1 到 4 个单词序列把句子分成四个 gram。鄙人面的预估中的“cat”应当是“code”。
你可以经由过程增长 gram 的数量让它变得更难。四个 gram 的模型是最相符仁攀类翻译的模型。我建议应用下面的代码运行几个例子并浏览 Wiki 页,来加深对这方面的懂得。
https://emilwallner.github.io/bootstrap/pred_1/
- 生成网站 2——original 2
这里我们做出了猜测:
一些输出样本的链接:
- 生成网站 1——original 1
https://emilwallner.github.io/bootstrap/real_2/
- 生成网站 3——original 3
https://emilwallner.github.io/bootstrap/pred_3/
- 生成网站 4——original 4
https://emilwallner.github.io/bootstrap/pred_4/