¿Æ¼¼Âþ̸ | AIGCÊÖÒմ󱬷¢£¬Ô½À´Ô½Öǻ۵ÄÈ˹¤ÖÇÄÜ£¬¿¿µÄÊÇʲô £¿

×ðÁúʱ¿­ÈËÉú¾ÍÊDz«¹ÙÍøz6mg

Ê×Ò³ > ÐÂÎż°Ã½Ìå > 2023

¿Æ¼¼Âþ̸ | AIGCÊÖÒմ󱬷¢£¬Ô½À´Ô½Öǻ۵ÄÈ˹¤ÖÇÄÜ£¬¿¿µÄÊÇʲô £¿

2023-08-26

×î½üAIȦ×Ó²»¿É²»Î½ÈÈÄÖ£¬±»³ÆÎª´óÄ£×Ó¡°µÓÚ¨Ñо¿¡±µÄ ¡¶Attention is All You Need¡·ÂÛÎĵİËλ×÷ÕßÒÑËùÓдÓGoogleÈ¥Ö°£¬Í¶ÉíAI´´Òµ£¬²¢ÇÒ¶¼ÊÕ»ñÁË×ÊÔ´Êг¡ÈϿɣ¬»ñµÃ¾Þ¶îͶ×Ê¡£µ±ÏÂ×î»ðÈȵÄOpenAIµÄGPTÄ£×Ó¡¢¹È¸èµÄBardÄ£×ÓÒ²¶¼²»Ô¼¶øÍ¬µØ½è¼øÁË¡¶Attention is All You Need¡·ÂÛÎÄÖеÄTransformer¼Ü¹¹¾ÙÐÐÉè¼Æ£¬Õâ¾ÍÈÃÈ˲»½ûºÃÆæ£ºÕâ¸ö¸Ä±äÁËAIÉú³¤Àú³Ì£¬Ê¹AIÕæÕý±äµÃ¡°ÖÇÄÜ¡±µÄTransformerÊÂʵÊǺη½ÉñÊ¥ÄØ £¿

640.png


£¨Í¼ Attention Is All You Need£©


½âÃÜTransformer£ºÌ½Ë÷´óÓïÑÔÄ£×Ó½¹µã


´ÓÒÑÍù¾ÐÄàÓÚ¹æÔòµÄ³ÌÐò£¬µ½ÏÖÔÚÄܹ»×ÔÎÒѧϰ¡¢×ÔÎÒ½ø»¯µÄÖÇÄÜÌ壬ÏÖÏÖÔÚµÄAIÊÇÔõÑù×öµ½·ÉËÙǰ½ø £¿ÔçÆÚµÄÑ­»·Éñ¾­Íø£¨Recurrent Neural Network£¬RNN£©µ½ÊÇ·ÇʱӰÏó£¨Long Short Term Memory£¬LSTM£©£¬´Ó¾í»ýÉñ¾­ÍøÂ磨Convolutional Neural Network, CNN£©µ½TransformerÄ£×Ó£¬ÕâЩÞÖ¿ÚÄÑÄîµÄÓ¢Îĵ¥´Ê£¬±³ºóÈ´ÊÇÈ˹¤ÖÇÄÜÁìÓòµÄÒ»²¨ÓÖÒ»²¨¸ïÃü¡£

640 (1).png


£¨Í¼ ´îÔØLLM´óÄ£×ÓµÄÔªÏíÖÇÄÜÔÆÆ½Ì¨£©


µ«ÔÚChatGPTºá¿Õ³öÉúǰ£¬×ÔÈ»ÓïÑÔ´¦Öóͷ£ÁìÓòµÄAI´óÓïÑÔÄ£×ÓÓ¦ÓÃËÆºõ¶¼ÀëÎÒÃÇ»¹ºÜÒ£Ô¶¡£ÒÔÍùµÄ¶Ô»°ÐÍAI£¬¾ÍÏñÊǸö³äÂúÔ¤Éę̀´ÊµÄ»úеÈË£¬²»¹ÜÄã˵ʲô£¬Ëü¶¼ÊÇÄÇÒ»Ì×»úеʽµÄ¡°if x; then a; else if y; then b¡­¡­ ¡±£¬Ö»»áÑ¡ÔñÄÚÈÝ£¬¶ø²»»á´´ÔìÄÚÈÝ¡£¿ÉÊÇ£¬Ëæ×ÅTransformerÄ£×ÓµÄո¶ͷ½Ç£¬´óÓïÑÔÄ£×ÓËÆºõÕÒµ½ÁËÐÂµÄÆ«Ïò¡£


ÄÇôTransformerÊÇÒÀÀµÊ²Ã´»úÖÆ»òÕß˵ÊÇÔ­Àí£¬ÈÃÔ­±¾²»¿ÉÃ÷È·ÈËÀàÓïÑÔµÄAI£¬±äµÄÄܹ»Ã÷È·²¢ÌìÉúÏìÓ¦ÄÚÈݵÄÄØ £¿Æä½¹µãÔÚÓÚ¡¶Attention is All You Need¡·ÂÛÎÄÖÐÌáµ½µÄ×Ô×¢ÖØÁ¦»úÖÆ£¬ÕâÖÖ»úÖÆÈÃÄ£×ÓÄܹ»ÔÚ´¦Öóͷ£Îı¾Ê±¸üºÃµØ²¶»ñÉÏÏÂÎÄÐÅÏ¢£¬½¨Éè´ÊÓë´ÊÖ®¼äµÄÁªÏµ£¬ËƺõÄ£ÄâÁËÈËÀà¶Ô»°µÄÁ¬¹áÐÔ¡£TransformerÄ£×Óͨ¹ý¶ÔÊäÈëÎı¾µÄ×ÔÎÒ¹Ø×¢£¬Äܹ»ÔÚ²î±ðλÖÃÖ®¼ä½¨Éè¹ØÁª£¬´Ó¶ø¸üºÃµØÃ÷È·Õû¸öÎı¾µÄÓïÒå½á¹¹£¬Ò²ÈóäÂú´´ÔìÁ¦µÄÌìÉúʽAI£¨AIGC£©³ÉΪ¿ÉÄÜ¡£

640 (4).png


£¨Í¼ ´îÔØAIGCÐéÄâÊý×ÖÈ˵ÄÔªÏíÊý×ÖħºÐ£©


ÊÍ·ÅÄ£×Ó´´ÔìÁ¦µÄ¶àÍ·×Ô×¢ÖØÁ¦»úÖÆ


TransformerʹÓÃ×¢ÖØÁ¦»úÖÆÀ´Ä£ÄâÈËÀà¶ÔÉÏÏÂÎĵÄÃ÷È·¡£ÕâÖÖ»úÖÆÔÊÐíÄ£×ÓÔÚ´¦Öóͷ£Îı¾Ê±£¬Æ¾Ö¤²î±ðλÖõĴʻ㽨Éè×Ô˳ӦµÄ×¢ÖØÁ¦¡£»»¾ä»°Ëµ£¬Ä£×ÓÄܹ»Ã÷ȷÿ¸ö´Ê»ãÓëÆäËû´Ê»ãÖ®¼äµÄ¹ØÏµ£¬²¢ÇÒ²»ÊÜ¡°¾àÀ롱µÄÏÞÖÆ¡ £¿´ËÆÖØ´óµÄ»úÖÆ£¬×ÅʵԭÀíºÜ¼òÆÓ£¬¾ÍÊÇͨ¹ýÅÌËãÿ¸ö´Ê»ãÖ®¼äµÄÏàËÆ¶È£¬À´¹¹½¨×¢ÖØÁ¦È¨ÖØ¡£²¢ÇÒ¶àÍ·»úÖÆµÄÒýÈëÔöÌíÁËÄ£×ӵIJ¢ÐÐÐÔ£¬´Ó¶ø¸ü¸ßЧµØ²¶»ñ´Ê»ãÖ®¼äµÄ¹ØÁª¡£


²»¹ýÖ»ÓйØÁªÐÔÊDz»·óµÄ£¬ÎªÁËսʤTransformerÄ£×ÓÎÞ·¨²¶»ñ´Ê»ã˳ÐòÐÅÏ¢µÄÎÊÌ⣬OpenAIÔÚGPTÄ£×ÓÖл¹ÒýÈëÁË¡°Î»ÖñàÂ롱ÊÖÒÕ£¬Äã¿ÉÒÔ°Ñ¡°Î»ÖñàÂ롱Ã÷ȷΪһ±¾¡°µØÍ¼¡±£¬Ëü¸æËßÿ¸ö´Ê»ãÔÚ¾ä×ÓÖеÄλÖá£ÕâÑùÒ»À´£¬´óÓïÑÔÄ£×ÓÄ£×Ó²»µ«ÄÜÃ÷È·´Ê»ãµÄÓïÒ壬»¹ÄܸÐÖªËüÃÇÔÚ¾ä×ÓÖеÄÂöÂç¡£¾ÍÓÌÈçÎÒÃÇÔÚÔĶÁʱ£¬»áƾ֤ÎÄ×ÖµÄλÖÃÀ´ÍƶÏËüÃǵÄÖ÷ÒªÐԺ͹ØÏµ¡£

640 (5).png



£¨Í¼ Multi-Headed Attention)

640.jpg


£¨Í¼ TransformerÄ£×Ó)

ÖÖÖÖ¾«ÃîµÄ»úÖÆÏ໥͎ᣬ×÷ÓýÁËÏÖÔÚ»ùÓÚTransformerµÄÖÖÖÖ´óÓïÑÔÄ£×Ó£¬Ò²ÈÃÔËÐдóÓïÑÔÄ£×ÓµÄAI²»ÔÙÖ»Äܹ»»úеʽ»Ø¸²£¬¶øÊdzÉΪһ¸öÄܹ»Éî¿ÌÃ÷È·Îı¾¡¢ÌìÉúÆæÒì»ØÓ¦µÄÖÇÄÜÌ塣ͨ¹ý×Ô×¢ÖØÁ¦¡¢¶àÍ·»úÖÆºÍλÖñàÂëµÄÅäºÏ×÷Óã¬Ä£×ÓÔÚ´¦Öóͷ£Îı¾Ê±£¬ÍðÈçһλʫÈË£¬Äܹ»ÓÃÇ¡µ½ÀûÒæµÄÑÔ´Ç£¬¹¹½¨³ö¾«²Ê·×³ÊµÄ¾ä×Ó£¬ÁîÈË̾Ϊ¹ÛÖ¹¡£Ò²ÈÃÈËÃÇ¿´µ½ÕâÏîÊÖÒÕÔËÓÃÔÚÐéÄâÊý×ÖÈËÉíÉϻᱬ·¢ÔõÑùµÄÊÖÒÕ¸ïÃü¡£

640 (6).png

£¨Í¼ GPT-3 µ½ ChatGPTµÄÐÄ·Àú³Ì£©


´óÓïÑÔÄ£×ÓÄܹ»ÎªÐéÄâÊý×ÖÈ˸¶Óë¡°Áé»ê¡±Â𠣿


´óÓïÑÔÄ£×Ó×÷ÓýµÄÌìÉúʽAI£¬ÈÃÈËÓë»úе¾ÙÐÐÎÄ×Ö¶Ô»°³ÉΪ¿ÉÄÜ£¬µ«ÔõÑùÄܹ»Í»ÆÆ¿Ö²À¹È£¬ÈûúеÈËÓëÈ˵Ľ»Á÷ÏñÈËÓëÈ˽»Á÷Ò»Ñù×ÔÈ»Á÷ͨ£¬ÔòÓÖÊÇÒ»¸öеÄÄÑÌâ¡£


×ðÁúʱ¿­ÈËÉú¾ÍÊDz«¹ÙÍøz6mg×Ó¹«Ë¾Ôª¾³¿Æ¼¼×ÔÑС¸MetaSurfing-ÔªÏíÖÇÄÜÔÆÆ½Ì¨¡¹£¬´îÔØÐÐÒµÁìÏȵÄÐéÄâÊý×ÖÈ˽»»¥ÏµÍ³¡¢´óÓïÑÔÄ£×Ó¡¢¶àģ̬¸ÐÖªµÈÊÖÒÕ£¬ÎªÐéÄâÊý×ÖÈ˸¶ÓëÁËÊÓ¾õ¡¢Ìý¾õºÍÓïÑÔÄÜÁ¦£¬Ê¹ÐéÄâÊý×ÖÈËÄܹ»ÏñÈËÀàÒ»Ñù½»Á÷¡¢Ã÷È·ºÍ˼Ë÷¡£²¢Í¨¹ý¡¸ÔªÏíÊý×ÖħºÐ¡¹ÒÔ3DÁ¢ÌåÐÎʽ·ºÆð³öÓÐÁé»ê¡¢ÓÐÓ°Ïó¡¢¶àÇéÐ÷¡¢¶à¸ÐÖª¡¢³¬Ð´ÊµµÄÈ«ÄâÕæÈËÀà¸öÌ壬ÈÃÐéÄâÊý×ÖÈË¿ÉÒÔÏñÕæÈËÒ»Ñù¾ÙÐС°ÃæÆËÃæ¡±½»»¥£¬ÓµÓÐ×Ô¼ºµÄ¡°ÉíÌ塱¡¢¡°ÑÔ´Ç¡±ºÍ¡°Í·ÄÔ¡±£¬ÈçÈËÀàÒ»Ñùƽ³£Í¨¹ýÓïÑÔ±í´ïÐÄÌïµÄÇéÐ÷ºÍ˼Ë÷¡£

640 (2).jpg

£¨Í¼ ´óÓïÑÔÄ£×ÓÄܹ»ÎªÐéÄâÊý×ÖÈ˸¶Óë¡°Áé»ê¡±Â𠣿£©

AIÔªÄê

ÕýÈç¡¶Attention is All You Need¡·ÂÛÎĵÄ×÷ÕßËùչʾµÄ£¬¿Æ¼¼µÄǰ½øÒ»Ö±Íƶ¯×ÅÈ˹¤ÖÇÄÜÁìÓòµÄÇ°ÑØÌ½Ë÷¡£µ±ÏÂÎÒÃÇÕýÔÚÉí´¦AIʱ´úµÄÀ˳±Ö®ÖУ¬ÑÛ¼û×Å´óÓïÑÔÄ£×ÓÓëÐéÄâÊý×ÖÈËÕâÁ½¸öÁìÓòµÄÅöײÓëÈںϣ¬Î´À´ÎÒÃÇ»òÐíÄܹ»ÔÚÐéÄâÌìÏÂÖÐÓëÐéÄâÊý×ÖÈ˾ÙÐÐÉî¿ÌµÄÕÜѧ¶Ô»°£¬Ì½ÌÖ2023ÄêµÄÕⳡAI¸ïÃü£¬¶ÔºóÊÀÒý·¢µÄÉîÔ¶Ó°Ïì¡£

ÍøÕ¾µØÍ¼