有没有什么可以快速入门的材料,看代码能看懂,但是不知道为啥会想到这些函数。

1 ipwx Jun 24, 2018 看着公式对照 API,可以理解一大部分奇怪的技巧。比如: 为啥用 tf.nn.log_softmax 而不是 tf.log(tf.nn.softmax) ? 因为 exp(x_i)/sum_j(exp(x_j)) 有可能因为 x_i 普遍偏大而 exp 溢出。但 log[exp(x_i)/sum_j(exp(x_j))] = x_i - logsumexp(x),而 logsumexp(x) = x_max + log[sum_j(exp(x_j - x_max))]。这么一变换,所有 exp 项变成 exp(x_j - x_max) 之后,exp 相都小于 1,就不溢出了。 |
2 diggerdu Jun 24, 2018 via iPhone 换 pytorch |
4 eccstartup OP |
5 spark Jun 24, 2018 via iPhone 唯有手熟尔 |
6 ca1123 Jun 24, 2018 tensorflow 到底想解决什么问题? |
7 aREMbosAl Jun 24, 2018 @eccstartup 你是说动态图?我只是单纯感觉 pytorch 文档写的好些,api 清晰些。。如果不能用也只有硬着头皮读 tf 文档了 |