Вар?ац?йний автокодувальник

百度已经分别与复旦大学、同济大学宣布共同发起设立校企合作科技创新平台，加速推动名校科技、产业优势与绿地资本、市场优势对接。

У машинному навчанн? вар?ац?йний автокодувальник (англ. variational autoencoder),^[1] в?домий також як ВАК (англ. VAE), — це арх?тектура штучно? нейронно? мереж?, запроваджена Д?дер?ком П. К?нгмою та Максом Велл?нгом^[en], що належить до с?мейств ?мов?рн?сних графових моделей та вар?ац?йних ба?сових метод?в^[en].

?? часто асоц?юють ?з моделлю автокодувальника^[2]^[3] через ?? арх?тектурну спор?днен?сть, але м?ж ними ? значн? в?дм?нност? як у ц?л?, так ? в математичному формулюванн?. Вар?ац?йн? автокодувальники призначено для стискання ?нформац?? входу до обмеженого багатовим?рного латентного розпод?лу (кодування), щоби в?дбудовувати ?? якомога точн?ше (декодування). Хоча первинно цей тип модел? було розроблено для некерованого навчання,^[4]^[5] його д??в?сть було доведено й в ?нших областях машинного навчання, таких як нап?вкероване^[6]^[7] та кероване навчання.^[8]

Арх?тектура

Вар?ац?йн? автокодувальники ? вар?ац?йними ба?совими методами з багатовим?рним розпод?лом як апр?орне, й апостер?орним, наближуваним штучною нейронною мережею, що утворюють так звану структуру вар?ац?йного кодувальника-декодувальника.^[9]^[10]^[11]

Стандартний кодувальник ? штучною нейронною мережею, здатною зводити свою вх?дну ?нформац?ю до найвужчого подання, що називають латентним простором. В?н явля? собою першу половину арх?тектури як автокодувальника, так ? вар?ац?йного автокодувальника: для першого виходом ? ф?ксований вектор штучних нейрон?в, а в другому ?нформац?я виходу стиска?ться до ймов?рн?сного латентного простору, що все ще склада?ться з? штучних нейрон?в. Проте в арх?тектур? вар?ац?йного автокодувальника вони представляють ? ?х розглядають як два р?зн? вектори однаково? вим?рност?, що подають вектор середн?х значень та вектор стандартних в?дхилень в?дпов?дно.

Стандартний декодувальник все ще ? штучною нейронною мережею, призначеною в?ддзеркалювати арх?тектуру кодувальника. В?н бере на вход? стиснену ?нформац?ю, що надходить ?з латентного простору, а пот?м розгорта? ??, виробляючи вих?д, якомога ближчий до входу кодувальника. ? хоча для автокодувальника вх?д декодувальника ? просто вектором д?йсних значень ф?ксовано? довжини, для вар?ац?йного автокодувальника необх?дно ввести пром?жний етап: враховуючи ймов?рн?сну природу латентного простору, можливо розглядати його як багатовим?рний гаусс?в вектор. За цього припущення й за допомогою методики, в?домо? як перепараметрувальний трюк (англ. reparametrization trick), можливо вибирати сукупност? з цього латентного простору й розглядати ?х точно як вектор д?йсних значень ф?ксовано? довжини.

З системно? точки зору модел? як стандартного, так ? вар?ац?йного автокодувальник?в отримують як вх?д наб?р даних велико? розм?рност?. Пот?м вони адаптивно стискають його до латентного простору (кодування) ?, нарешт?, намагаються якомога точн?ше його в?дбудувати (декодування). Враховуючи природу його латентного простору, вар?ац?йний автокодувальник характеризу?ться дещо ?ншою ц?льовою функц??ю: в?н ма? м?н?м?зувати функц?ю втрат в?дбудови, як ? стандартний автокодувальник. Проте в?н також врахову? розходження Кульбака — Лейблера м?ж латентним простором та вектором нормальних гаусс?ан.

Формулювання

З формально? точки зору, за заданого набору даних входу $\mathbf {x}$ , описуваного нев?домою функц??ю ймов?рност? $P(\mathbf {x} )$ , та багатовим?рного вектора латентного кодування $\mathbf {z}$ , мета поляга? в моделюванн? цих даних як розпод?лу $p_{\theta }(\mathbf {x} )$ , де $\theta$ визначено як наб?р параметр?в мереж?.

Цей розпод?л можливо формал?зувати як

$p_{\theta }(\mathbf {x} )=\int _{\mathbf {z} }p_{\theta }(\mathbf {x,z} )d\mathbf {z}$

де $p_{\theta }$ ? св?дченням даних ц??? модел? з в?дособленням, виконаним над неспостережуваними зм?нними, й в?дтак $p_{\theta }(\mathbf {x,z} )$ пода? сп?льний розпод?л даних входу та ?хнього латентного подання в?дпов?дно до параметр?в мереж? $\theta$ .

В?дпов?дно до теореми Ба?са, це р?вняння можливо переписати як

$p_{\theta }(\mathbf {x} )=\int _{\mathbf {z} }p_{\theta }(\mathbf {x|z} )p_{\theta }(\mathbf {z} )d\mathbf {z}$

У стандартному вар?ац?йному автокодувальнику ми вважа?мо, що $\mathbf {z}$ ма? ск?нченну розм?рн?сть, ? що $p_{\theta }(\mathbf {x|z} )$ ? гауссовим розпод?лом, тод? $p_{\theta }(\mathbf {x} )$ ? сум?шшю гауссових розпод?л?в.

Тепер можливо визначити наб?р вза?мозв'язк?в м?ж даними входу та ?х латентним поданням як

Апр?орне $p_{\theta }(\mathbf {z} )$
Правдопод?бн?сть $p_{\theta }(\mathbf {x} |\mathbf {z} )$
Апостер?орне $p_{\theta }(\mathbf {z} |\mathbf {x} )$

На жаль, обчислення $p_{\theta }(\mathbf {x} )$ ? дуже витратним, ? в б?льшост? випадк?в нав?ть неп?ддатливим. Щоби пришвидшити це обчислення й зробити його зд?йсненним, необх?дно ввести додаткову функц?ю для наближення апостер?орного розпод?лу:

$q_{\Phi }(\mathbf {z|x} )\approx p_{\theta }(\mathbf {z|x} )$

де $\Phi$ визначено як наб?р д?йсних значень, що параметру? $q$ .

Таким чином загальну задачу можливо легко перевести до област? визначення автокодувальника, в якому розпод?л умовно? правдопод?бност? $p_{\theta }(\mathbf {x} |\mathbf {z} )$ провадиться ?мов?рн?сним кодувальником (англ. probabilistic encoder), а наближений апостер?орний розпод?л $q_{\Phi }(\mathbf {z|x} )$ обчислю?ться ?мов?рн?сним декодувальником (англ. probabilistic decoder).

Функц?я втрат НМЕС

Як ? в будь-як?й задач? глибокого навчання, щоб уточнювати ваги мереж? шляхом зворотного поширення, необх?дно визначити диференц?йовну функц?ю втрат.

Для вар?ац?йних автокодувальник?в ?дея поляга? в сп?льному м?н?м?зуванн? параметр?в породжувально? модел? $\theta$ , щоби зменшувати похибку в?дбудови м?ж входом ? виходом мереж?, та $\Phi$ , щоби мати $q_{\Phi }(\mathbf {z|x} )$ якомога ближчою до $p_{\theta }(\mathbf {z} |\mathbf {x} )$ .

Як втрати в?дбудови, добрими вар?антами ? середньоквадратична похибка та перехресна ентроп?я.

Як втрати в?дстан? м?ж цими двома розпод?лами, добрим вибором, щоби втискувати $q_{\Phi }(\mathbf {z|x} )$ п?д $p_{\theta }(\mathbf {z} |\mathbf {x} )$ , ? обернене розходження Кульбака — Лейблера $D_{KL}(q_{\Phi }(\mathbf {z|x} )||p_{\theta }(\mathbf {z|x} ))$ .^[1]^[12]

Щойно визначен? втрати в?дстан? розкриваються як

${\begin{aligned}D_{KL}(q_{\Phi }(\mathbf {z|x} )||p_{\theta }(\mathbf {z|x} ))&=\int q_{\Phi }(\mathbf {z|x} )\log {\frac {q_{\Phi }(\mathbf {z|x} )}{p_{\theta }(\mathbf {z|x} )}}d\mathbf {z} \\&=\int q_{\Phi }(\mathbf {z|x} )\log {\frac {q_{\Phi }(\mathbf {z|x} )p_{\theta }(\mathbf {x} )}{p_{\theta }(\mathbf {z,x} )}}d\mathbf {z} \\&=\int q_{\Phi }(\mathbf {z|x} )\left(\log(p_{\theta }(\mathbf {x} ))+\log {\frac {q_{\Phi }(\mathbf {z|x} )}{p_{\theta }(\mathbf {z,x} )}}\right)d\mathbf {z} \\&=\log(p_{\theta }(\mathbf {x} ))+\int q_{\Phi }(\mathbf {z|x} )\log {\frac {q_{\Phi }(\mathbf {z|x} )}{p_{\theta }(\mathbf {z,x} )}}d\mathbf {z} \\&=\log(p_{\theta }(\mathbf {x} ))+\int q_{\Phi }(\mathbf {z|x} )\log {\frac {q_{\Phi }(\mathbf {z|x} )}{p_{\theta }(\mathbf {x|z} )p_{\theta }(\mathbf {z} )}}d\mathbf {z} \\&=\log(p_{\theta }(\mathbf {x} ))+E_{\mathbf {z} \sim q_{\Phi }(\mathbf {z|x} )}(\log {\frac {q_{\Phi }(\mathbf {z|x} )}{p_{\theta }(\mathbf {z} )}}-\log(p_{\theta }(\mathbf {x|z} )))\\&=\log(p_{\theta }(\mathbf {x} ))+D_{KL}(q_{\Phi }(\mathbf {z|x} )||p_{\theta }(\mathbf {z} ))-E_{\mathbf {z} \sim q_{\Phi }(\mathbf {z|x} )}(\log(p_{\theta }(\mathbf {x|z} )))\end{aligned}}$

На цьому етап? можливо переписати це р?вняння як

$\log(p_{\theta }(\mathbf {x} ))-D_{KL}(q_{\Phi }(\mathbf {z|x} )||p_{\theta }(\mathbf {z|x} ))=E_{\mathbf {z} \sim q_{\Phi }(\mathbf {z|x} )}(\log(p_{\theta }(\mathbf {x|z} )))-D_{KL}(q_{\Phi }(\mathbf {z|x} )||p_{\theta }(\mathbf {z} ))$

Метою ? максим?зувати логарифм?чну правдопод?бн?сть л?во? частини цього р?вняння для пол?пшення якост? породжуваних даних та м?н?м?зування в?дстаней м?ж розпод?лами справжнього та оц?нюваного апостер?орних.

Це ? р?внозначним м?н?м?зуванню в?д'?мно? логарифм?чно? правдопод?бност?, що ? типовою практикою в задачах оптим?зац??.

Отриману таким чином функц?ю втрат, яку також називають функц??ю втрат нижньо? меж? св?дчення^[en] (англ. evidence lower bound), скорочено НМЕС (англ. ELBO), можливо записати як

$L_{\theta ,\Phi }=-\log(p_{\theta }(\mathbf {x} ))+D_{KL}(q_{\Phi }(\mathbf {z|x} )||p_{\theta }(\mathbf {z|x} ))=-E_{\mathbf {z} \sim q_{\Phi }(\mathbf {z|x} )}(\log(p_{\theta }(\mathbf {x|z} )))+D_{KL}(q_{\Phi }(\mathbf {z|x} )||p_{\theta }(\mathbf {z} ))$

Враховуючи властив?сть нев?д'?мност? розходження Кульбака — Лейблера, буде правильним стверджувати, що

$-L_{\theta ,\Phi }=\log(p_{\theta }(\mathbf {x} ))-D_{KL}(q_{\Phi }(\mathbf {z|x} )||p_{\theta }(\mathbf {z|x} ))\leq \log(p_{\theta }(\mathbf {x} ))$

Оптимальними параметрами ? т?, як? м?н?м?зують цю функц?ю втрат. Цю задачу можливо узагальнити як

$\theta ^{*},\Phi ^{*}={\underset {\theta ,\Phi }{argmin}}L_{\theta ,\Phi }$

Основна перевага цього формулювання поляга? в можливост? сп?льного оптим?зування за параметрами $\theta$ та $\Phi$ .

Перш н?ж застосовувати функц?ю втрат НМЕС до задач? оптим?зування для зворотного поширення град??нта, необх?дно зробити ?? диференц?йовною, застосувавши так званий трюк перепараметрування (англ. reparameterization trick), щоб усунути стохастичне вибирання з цього формування, й таким чином зробити ?? диференц?йовною.

Трюк перепараметрування

Щоб зробити формулювання НМЕС придатним для ц?лей тренування, необх?дно ввести подальшу незначну зм?ну до формулювання задач?, а також до структури вар?ац?йного автокодувальника.^[1]^[13]^[14]

Стохастичне вибирання ? недиференц?йовною операц??ю, через яку можливо вибирати з латентного простору й подавати на ймов?рн?сний декодувальник.

Щоб уможливити застосування процес?в зворотного поширення, таких як стохастичний град??нтний спуск, запроваджують трюк перепараметрування.

Основним припущенням про латентний прост?р ? те, що його можливо розглядати як сукупн?сть багатовим?рних гауссових розпод?л?в ?, отже, можливо описати як

$\mathbf {z} \sim q_{\phi }(\mathbf {z} \vert \mathbf {x} )={\mathcal {N}}({\boldsymbol {\mu }},{\boldsymbol {\sigma }}^{2})$

Якщо ${\boldsymbol {\epsilon }}\sim {\mathcal {N}}(0,{\boldsymbol {I}})$ , а $\odot$ визначено як поелементний добуток, то трюк перепараметрування зм?ню? наведене вище р?вняння до

$\mathbf {z} ={\boldsymbol {\mu }}+{\boldsymbol {\sigma }}\odot {\boldsymbol {\epsilon }}$ .

Завдяки цьому перетворенню, яке можливо поширити й на ?нш? розпод?ли, в?дм?нн? в?д гауссового, вар?ац?йний автокодувальник п?дда?ться тренуванню, а ймов?рн?сний кодувальник ма? навчатися в?дображувати стиснене подання вх?дних даних у два латентн? вектори ${\boldsymbol {\mu }}$ та ${\boldsymbol {\sigma }}$ , тод? як стохастичн?сть залиша?ться виключеною з процесу уточнювання, й вводиться до латентного простору як зовн?шн?й вх?д через випадковий вектор ${\boldsymbol {\epsilon }}$ .

Р?зновиди

?сну? багато застосувань ? розширень вар?ац?йних автокодувальник?в для пристосовування ц??? арх?тектури до р?зних областей та пол?пшення ?? продуктивност?.

β-ВАК (англ. β-VAE) ? вт?ленням з? зваженим членом розходження Кульбака — Лейблера для автоматичного виявляння та ?нтерпретування розкладених латентних подань. За допомогою цього вт?лення можливо нав'язувати розплутування многовиду для значень $\beta$ , б?льших за одиницю. Автори показали здатн?сть ц??? арх?тектури породжувати високояк?сн? синтетичн? зразки.^[15]^[16]

Ще одне вт?лення, назване умовним вар?ац?йним автокодувальником (англ. conditional variational autoencoder), скорочено УВАК (англ. CVAE), як вважають, вставля? м?ткову ?нформац?ю до латентного простору, нав'язуючи детерм?новане обмежене подання навчених даних.^[17]

Деяк? структури безпосередньо займаються як?стю породжуваних зразк?в^[18]^[19] або вт?люють понад одного латентного простору для подальшого пол?пшення навчання подань.^[20]^[21]

Деяк? арх?тектури по?днують структури вар?ац?йних автокодувальник?в та породжувальних змагальних мереж, щоб отримувати г?бридн? модел? з високими породжувальними спроможностями.^[22]^[23]^[24]

Див. також

Прим?тки

↑ ^а ^б ^в Kingma, Diederik P.; Welling, Max (1 травня 2014). Auto-Encoding Variational Bayes. arXiv:1312.6114 [stat.ML]. (англ.)
↑ Kramer, Mark A. (1991). Nonlinear principal component analysis using autoassociative neural networks. AIChE Journal (англ.). 37 (2): 233—243. doi:10.1002/aic.690370209. Арх?в ориг?налу за 8 червня 2021. Процитовано 3 липня 2021. (англ.)
↑ Hinton, G. E.; Salakhutdinov, R. R. (28 липня 2006). Reducing the Dimensionality of Data with Neural Networks. Science (англ.). 313 (5786): 504—507. Bibcode:2006Sci...313..504H. doi:10.1126/science.1127647. PMID 16873662. S2CID 1658773. Арх?в ориг?налу за 28 червня 2021. Процитовано 3 липня 2021. (англ.)
↑ Dilokthanakul, Nat; Mediano, Pedro A. M.; Garnelo, Marta; Lee, Matthew C. H.; Salimbeni, Hugh; Arulkumaran, Kai; Shanahan, Murray (13 с?чня 2017). Deep Unsupervised Clustering with Gaussian Mixture Variational Autoencoders. arXiv:1611.02648 [cs.LG]. (англ.)
↑ Hsu, Wei-Ning; Zhang, Yu; Glass, James (December 2017). Unsupervised domain adaptation for robust speech recognition via variational autoencoder-based data augmentation. 2017 IEEE Automatic Speech Recognition and Understanding Workshop (ASRU). с. 16—23. arXiv:1707.06265. doi:10.1109/ASRU.2017.8268911. ISBN 978-1-5090-4788-8. S2CID 22681625. Арх?в ориг?налу за 28 серпня 2021. Процитовано 3 липня 2021. (англ.)
↑ Ehsan Abbasnejad, M.; Dick, Anthony; van den Hengel, Anton (2017). Infinite Variational Autoencoder for Semi-Supervised Learning. с. 5888—5897. Арх?в ориг?налу за 24 червня 2021. Процитовано 3 липня 2021. (англ.)
↑ Xu, Weidi; Sun, Haoze; Deng, Chao; Tan, Ying (12 лютого 2017). Variational Autoencoder for Semi-Supervised Text Classification. Proceedings of the AAAI Conference on Artificial Intelligence (англ.). 31 (1). Арх?в ориг?налу за 16 червня 2021. Процитовано 3 липня 2021. (англ.)
↑ Kameoka, Hirokazu; Li, Li; Inoue, Shota; Makino, Shoji (1 вересня 2019). Supervised Determined Source Separation with Multichannel Variational Autoencoder. Neural Computation. 31 (9): 1891—1914. doi:10.1162/neco_a_01217. PMID 31335290. S2CID 198168155. Арх?в ориг?налу за 16 червня 2021. Процитовано 3 липня 2021. (англ.)
↑ An, J., & Cho, S. (2015). Variational autoencoder based anomaly detection using reconstruction probability. Special Lecture on IE, 2(1). (англ.)
↑ Заповн?ть пропущен? параметри: назву ?/або автор?в. arXiv:1911.12410. (англ.)
↑ Kingma, Diederik P.; Welling, Max (2019). An Introduction to Variational Autoencoders. Foundations and Trends in Machine Learning. 12 (4): 307—392. arXiv:1906.02691. doi:10.1561/2200000056. ISSN 1935-8237. S2CID 174802445. (англ.)
↑ From Autoencoder to Beta-VAE. Lil'Log (англ.). 12 серпня 2018. Арх?в ориг?налу за 14 травня 2021. Процитовано 3 липня 2021.
↑ Bengio, Yoshua; Courville, Aaron; Vincent, Pascal (2013). Representation Learning: A Review and New Perspectives. IEEE Transactions on Pattern Analysis and Machine Intelligence. 35 (8): 1798—1828. arXiv:1206.5538. doi:10.1109/TPAMI.2013.50. ISSN 1939-3539. PMID 23787338. S2CID 393948. Арх?в ориг?налу за 27 червня 2021. Процитовано 3 липня 2021. (англ.)
↑ Kingma, Diederik P.; Rezende, Danilo J.; Mohamed, Shakir; Welling, Max (31 жовтня 2014). Semi-Supervised Learning with Deep Generative Models. arXiv:1406.5298 [cs.LG]. (англ.)
↑ >Higgins, Irina; Matthey, Loic; Pal, Arka; Burgess, Christopher; Glorot, Xavier; Botvinick, Matthew; Mohamed, Shakir; Lerchner, Alexander (4 листопада 2016). beta-VAE: Learning Basic Visual Concepts with a Constrained Variational Framework (англ.). Арх?в ориг?налу за 20 липня 2021. Процитовано 3 липня 2021. (англ.)
↑ >Burgess, Christopher P.; Higgins, Irina; Pal, Arka; Matthey, Loic; Watters, Nick; Desjardins, Guillaume; Lerchner, Alexander (10 кв?тня 2018). Understanding disentangling in β-VAE. arXiv:1804.03599 [stat.ML]. (англ.)
↑ Sohn, Kihyuk; Lee, Honglak; Yan, Xinchen (1 с?чня 2015). Learning Structured Output Representation using Deep Conditional Generative Models (PDF) (англ.). Арх?в ориг?налу (PDF) за 9 липня 2021. Процитовано 3 липня 2021. (англ.)
↑ Dai, Bin; Wipf, David (30 жовтня 2019). Diagnosing and Enhancing VAE Models. arXiv:1903.05789 [cs.LG]. (англ.)
↑ Dorta, Garoe; Vicente, Sara; Agapito, Lourdes; Campbell, Neill D. F.; Simpson, Ivor (31 липня 2018). Training VAEs Under Structured Residuals. arXiv:1804.01050 [stat.ML]. (англ.)
↑ Tomczak, Jakub; Welling, Max (31 березня 2018). VAE with a VampPrior. International Conference on Artificial Intelligence and Statistics (англ.). PMLR: 1214—1223. arXiv:1705.07120. Арх?в ориг?налу за 24 червня 2021. Процитовано 3 липня 2021. (англ.)
↑ Razavi, Ali; Oord, Aaron van den; Vinyals, Oriol (2 червня 2019). Generating Diverse High-Fidelity Images with VQ-VAE-2. arXiv:1906.00446 [cs.LG]. (англ.)
↑ Larsen, Anders Boesen Lindbo; S?nderby, S?ren Kaae; Larochelle, Hugo; Winther, Ole (11 червня 2016). Autoencoding beyond pixels using a learned similarity metric. International Conference on Machine Learning (англ.). PMLR: 1558—1566. arXiv:1512.09300. Арх?в ориг?налу за 17 травня 2021. Процитовано 3 липня 2021. (англ.)
↑ Bao, Jianmin; Chen, Dong; Wen, Fang; Li, Houqiang; Hua, Gang (2017). CVAE-GAN: Fine-Grained Image Generation Through Asymmetric Training. с. 2745—2754. arXiv:1703.10155 [cs.CV]. (англ.)
↑ >Gao, Rui; Hou, Xingsong; Qin, Jie; Chen, Jiaxin; Liu, Li; Zhu, Fan; Zhang, Zhao; Shao, Ling (2020). Zero-VAE-GAN: Generating Unseen Features for Generalized and Transductive Zero-Shot Learning. IEEE Transactions on Image Processing. 29: 3665—3680. Bibcode:2020ITIP...29.3665G. doi:10.1109/TIP.2020.2964429. ISSN 1941-0042. PMID 31940538. S2CID 210334032. Арх?в ориг?налу за 28 червня 2021. Процитовано 3 липня 2021. (англ.)

[:0-1] а ^б ^в Kingma, Diederik P.; Welling, Max (1 травня 2014). Auto-Encoding Variational Bayes. arXiv:1312.6114 [stat.ML]. (англ.)

[2] Kramer, Mark A. (1991). Nonlinear principal component analysis using autoassociative neural networks. AIChE Journal (англ.). 37 (2): 233—243. doi:10.1002/aic.690370209. Арх?в ориг?налу за 8 червня 2021. Процитовано 3 липня 2021. (англ.)

[3] Hinton, G. E.; Salakhutdinov, R. R. (28 липня 2006). Reducing the Dimensionality of Data with Neural Networks. Science (англ.). 313 (5786): 504—507. Bibcode:2006Sci...313..504H. doi:10.1126/science.1127647. PMID 16873662. S2CID 1658773. Арх?в ориг?налу за 28 червня 2021. Процитовано 3 липня 2021. (англ.)

[4] Dilokthanakul, Nat; Mediano, Pedro A. M.; Garnelo, Marta; Lee, Matthew C. H.; Salimbeni, Hugh; Arulkumaran, Kai; Shanahan, Murray (13 с?чня 2017). Deep Unsupervised Clustering with Gaussian Mixture Variational Autoencoders. arXiv:1611.02648 [cs.LG]. (англ.)

[5] Hsu, Wei-Ning; Zhang, Yu; Glass, James (December 2017). Unsupervised domain adaptation for robust speech recognition via variational autoencoder-based data augmentation. 2017 IEEE Automatic Speech Recognition and Understanding Workshop (ASRU). с. 16—23. arXiv:1707.06265. doi:10.1109/ASRU.2017.8268911. ISBN 978-1-5090-4788-8. S2CID 22681625. Арх?в ориг?налу за 28 серпня 2021. Процитовано 3 липня 2021. (англ.)

[6] Ehsan Abbasnejad, M.; Dick, Anthony; van den Hengel, Anton (2017). Infinite Variational Autoencoder for Semi-Supervised Learning. с. 5888—5897. Арх?в ориг?налу за 24 червня 2021. Процитовано 3 липня 2021. (англ.)

[7] Xu, Weidi; Sun, Haoze; Deng, Chao; Tan, Ying (12 лютого 2017). Variational Autoencoder for Semi-Supervised Text Classification. Proceedings of the AAAI Conference on Artificial Intelligence (англ.). 31 (1). Арх?в ориг?налу за 16 червня 2021. Процитовано 3 липня 2021. (англ.)

[8] Kameoka, Hirokazu; Li, Li; Inoue, Shota; Makino, Shoji (1 вересня 2019). Supervised Determined Source Separation with Multichannel Variational Autoencoder. Neural Computation. 31 (9): 1891—1914. doi:10.1162/neco_a_01217. PMID 31335290. S2CID 198168155. Арх?в ориг?налу за 16 червня 2021. Процитовано 3 липня 2021. (англ.)

[:2-9] An, J., & Cho, S. (2015). Variational autoencoder based anomaly detection using reconstruction probability. Special Lecture on IE, 2(1). (англ.)

[1bitVAE-10] Заповн?ть пропущен? параметри: назву ?/або автор?в. arXiv:1911.12410. (англ.)

[11] Kingma, Diederik P.; Welling, Max (2019). An Introduction to Variational Autoencoders. Foundations and Trends in Machine Learning. 12 (4): 307—392. arXiv:1906.02691. doi:10.1561/2200000056. ISSN 1935-8237. S2CID 174802445. (англ.)

[12] From Autoencoder to Beta-VAE. Lil'Log (англ.). 12 серпня 2018. Арх?в ориг?налу за 14 травня 2021. Процитовано 3 липня 2021.

[13] Bengio, Yoshua; Courville, Aaron; Vincent, Pascal (2013). Representation Learning: A Review and New Perspectives. IEEE Transactions on Pattern Analysis and Machine Intelligence. 35 (8): 1798—1828. arXiv:1206.5538. doi:10.1109/TPAMI.2013.50. ISSN 1939-3539. PMID 23787338. S2CID 393948. Арх?в ориг?налу за 27 червня 2021. Процитовано 3 липня 2021. (англ.)

[14] Kingma, Diederik P.; Rezende, Danilo J.; Mohamed, Shakir; Welling, Max (31 жовтня 2014). Semi-Supervised Learning with Deep Generative Models. arXiv:1406.5298 [cs.LG]. (англ.)

[15] >Higgins, Irina; Matthey, Loic; Pal, Arka; Burgess, Christopher; Glorot, Xavier; Botvinick, Matthew; Mohamed, Shakir; Lerchner, Alexander (4 листопада 2016). beta-VAE: Learning Basic Visual Concepts with a Constrained Variational Framework (англ.). Арх?в ориг?налу за 20 липня 2021. Процитовано 3 липня 2021. (англ.)

[16] >Burgess, Christopher P.; Higgins, Irina; Pal, Arka; Matthey, Loic; Watters, Nick; Desjardins, Guillaume; Lerchner, Alexander (10 кв?тня 2018). Understanding disentangling in β-VAE. arXiv:1804.03599 [stat.ML]. (англ.)

[17] Sohn, Kihyuk; Lee, Honglak; Yan, Xinchen (1 с?чня 2015). Learning Structured Output Representation using Deep Conditional Generative Models (PDF) (англ.). Арх?в ориг?налу (PDF) за 9 липня 2021. Процитовано 3 липня 2021. (англ.)

[18] Dai, Bin; Wipf, David (30 жовтня 2019). Diagnosing and Enhancing VAE Models. arXiv:1903.05789 [cs.LG]. (англ.)

[19] Dorta, Garoe; Vicente, Sara; Agapito, Lourdes; Campbell, Neill D. F.; Simpson, Ivor (31 липня 2018). Training VAEs Under Structured Residuals. arXiv:1804.01050 [stat.ML]. (англ.)

[20] Tomczak, Jakub; Welling, Max (31 березня 2018). VAE with a VampPrior. International Conference on Artificial Intelligence and Statistics (англ.). PMLR: 1214—1223. arXiv:1705.07120. Арх?в ориг?налу за 24 червня 2021. Процитовано 3 липня 2021. (англ.)

[21] Razavi, Ali; Oord, Aaron van den; Vinyals, Oriol (2 червня 2019). Generating Diverse High-Fidelity Images with VQ-VAE-2. arXiv:1906.00446 [cs.LG]. (англ.)

[22] Larsen, Anders Boesen Lindbo; S?nderby, S?ren Kaae; Larochelle, Hugo; Winther, Ole (11 червня 2016). Autoencoding beyond pixels using a learned similarity metric. International Conference on Machine Learning (англ.). PMLR: 1558—1566. arXiv:1512.09300. Арх?в ориг?налу за 17 травня 2021. Процитовано 3 липня 2021. (англ.)

[23] Bao, Jianmin; Chen, Dong; Wen, Fang; Li, Houqiang; Hua, Gang (2017). CVAE-GAN: Fine-Grained Image Generation Through Asymmetric Training. с. 2745—2754. arXiv:1703.10155 [cs.CV]. (англ.)

[24] >Gao, Rui; Hou, Xingsong; Qin, Jie; Chen, Jiaxin; Liu, Li; Zhu, Fan; Zhang, Zhao; Shao, Ling (2020). Zero-VAE-GAN: Generating Unseen Features for Generalized and Transductive Zero-Shot Learning. IEEE Transactions on Image Processing. 29: 3665—3680. Bibcode:2020ITIP...29.3665G. doi:10.1109/TIP.2020.2964429. ISSN 1941-0042. PMID 31940538. S2CID 210334032. Арх?в ориг?налу за 28 червня 2021. Процитовано 3 липня 2021. (англ.)

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]

[15]

[16]

[17]

[18]

[19]

[20]

[21]

[22]

[23]

[24]

八字缺什么怎么算	什么时候打仗	腔隙灶是什么意思	小孩干呕是什么原因	女人什么时候绝经正常
感冒吃什么食物好	吃什么东西能通便	硬度不够吃什么药	太阳鱼吃什么食物	孕妇吃什么
小太阳是什么牌子	花钱是什么意思	吃人参对身体有什么好处	2006属狗的五行缺什么	青光眼是什么原因引起的
六月八号什么星座	天枢是什么意思	手腕血管疼是什么原因	燕窝有什么功效和作用	UFS是什么意思

一什么尾巴hcv9jop4ns4r.cn	搞破鞋是什么意思hcv8jop7ns2r.cn	省油的灯是什么意思hcv8jop3ns2r.cn	血糖高能吃什么肉hcv8jop0ns0r.cn	3月28日是什么星座hcv8jop2ns6r.cn
就餐是什么意思hcv8jop6ns1r.cn	什么伐桂hcv8jop9ns2r.cn	疱疹一般长在什么部位hcv8jop4ns3r.cn	农历十月是什么月hcv9jop3ns4r.cn	黄金分割点是什么sanhestory.com
肝阴虚吃什么中成药hcv8jop8ns6r.cn	走胎是什么意思hcv9jop6ns8r.cn	文曲星什么意思hcv9jop1ns0r.cn	重庆房价为什么这么低jingluanji.com	为什么会有黑眼圈hcv7jop6ns1r.cn
wy是什么牌子hcv9jop3ns4r.cn	椭圆脸适合什么发型男hcv8jop8ns1r.cn	打冷是什么意思hcv9jop6ns0r.cn	检查有没有怀孕挂什么科travellingsim.com	妇科炎症是什么原因引起的hcv7jop7ns2r.cn