{"id":201310,"date":"2023-09-22T16:02:10","date_gmt":"2023-09-22T14:02:10","guid":{"rendered":"https:\/\/mediarun.com\/pl\/?p=201310"},"modified":"2023-09-22T16:02:10","modified_gmt":"2023-09-22T14:02:10","slug":"polacy-stworzyli-model-jezykowy-wydajniejszy-niz-chatgpt","status":"publish","type":"post","link":"https:\/\/mediarun.com\/pl\/trendy\/polacy-stworzyli-model-jezykowy-wydajniejszy-niz-chatgpt.html","title":{"rendered":"Polacy stworzyli model j\u0119zykowy wydajniejszy ni\u017c ChatGPT?"},"content":{"rendered":"<p>W Polsce dosz\u0142o do prze\u0142omowego wydarzenia w dziedzinie sztucznej inteligencji i przetwarzania j\u0119zyka naturalnego. Zesp\u00f3\u0142 badaczy zwi\u0105zanych z <strong>Uniwersytetem Warszawskim<\/strong> (UW), <strong>Polsk\u0105 Akademi\u0105 Nauk<\/strong> (PAN) oraz <strong>Narodowym Centrum Bada\u0144 i Rozwoju (IDEAS NCBR)<\/strong> og\u0142osi\u0142 stworzenie nowego, pot\u0119\u017cnego modelu j\u0119zykowego nazwanego LongLLaMA. Ten innowacyjny model mo\u017ce obs\u0142ugiwa\u0107 teksty o d\u0142ugo\u015bci nawet 64 razy wi\u0119kszej ni\u017c znany ChatGPT. To wydarzenie jest nie tylko wa\u017cnym osi\u0105gni\u0119ciem naukowym, ale tak\u017ce ma potencja\u0142 rewolucyjny dla wielu dziedzin zwi\u0105zanych z przetwarzaniem j\u0119zyka naturalnego.<\/p>\n<h2>LongLLaMA z ogromnym potencja\u0142em<\/h2>\n<p><strong>LongLLaMA<\/strong> jest oparty na oprogramowaniu <strong>OpenLLaMA,<\/strong> kt\u00f3re zosta\u0142o stworzone przez <strong>Meta,<\/strong> w\u0142a\u015bciciela <strong>Facebooka.<\/strong> Model ten znacz\u0105co przewy\u017csza swojego konkurenta, <strong>ChatGPT,<\/strong> pod wzgl\u0119dem mo\u017cliwo\u015bci przetwarzania tekstu. Warto podkre\u015bli\u0107, \u017ce badacze polscy maj\u0105 zas\u0142ug\u0119 w modyfikacji tego oprogramowania, co pozwoli\u0142o na stworzenie <strong>LongLLaMA.<\/strong><\/p>\n<p>Wed\u0142ug dr hab. <strong>Piotra Mi\u0142o\u015ba,<\/strong> profesora <strong>Polskiej Akademii Nauk<\/strong> i lidera zespo\u0142u badawczego w <strong>IDEAS NCBR,<\/strong> LongLLaMA mo\u017ce przetwarza\u0107 jednorazowo nawet 8 tysi\u0119cy token\u00f3w, co odpowiada oko\u0142o 30-50 stronom tekstu. W niekt\u00f3rych przypadkach model ten jest w stanie obs\u0142u\u017cy\u0107 a\u017c 256 tysi\u0119cy token\u00f3w, co stanowi znacz\u0105cy skok w por\u00f3wnaniu do istniej\u0105cych modeli. Co wi\u0119cej, <strong>LongLLaMA<\/strong> dzia\u0142a wyj\u0105tkowo efektywnie i zu\u017cywa niewielk\u0105 ilo\u015b\u0107 energii, co jest wa\u017cne z punktu widzenia zr\u00f3wnowa\u017conego rozwoju technologii.<\/p>\n<h2>Co wyr\u00f3\u017cnia model j\u0119zykowy stworzony prze Polak\u00f3w?<\/h2>\n<p>Jedn\u0105 z najwa\u017cniejszych zalet <strong>LongLLaMA<\/strong> jest jego zdolno\u015b\u0107 do przetwarzania bardzo d\u0142ugich danych wej\u015bciowych. Model ten mo\u017ce pracowa\u0107 z dowoln\u0105 ilo\u015bci\u0105 kontekstu, nie ograniczaj\u0105c si\u0119 do okre\u015blonego limitu token\u00f3w. W przeprowadzonych testach, gdzie badano zdolno\u015b\u0107 modelu do przypomnienia sobie has\u0142a podanego na pocz\u0105tku d\u0142ugiego tekstu, <strong>LongLLaMA<\/strong> osi\u0105gn\u0119\u0142a znakomit\u0105 dok\u0142adno\u015b\u0107. Podczas gdy konkurencyjny model <strong>OpenLLaMA<\/strong> radzi\u0142 sobie jedynie z promptem o d\u0142ugo\u015bci 2 tysi\u0119cy token\u00f3w, LongLLaMA zachowywa\u0142a 94,5% dok\u0142adno\u015bci po otrzymaniu promptu o d\u0142ugo\u015bci 100 tysi\u0119cy token\u00f3w i 73% dok\u0142adno\u015bci po otrzymaniu 256 tysi\u0119cy token\u00f3w.<\/p>\n<p><strong>LongLLaMA<\/strong> otwiera nowe mo\u017cliwo\u015bci w dziedzinie przetwarzania j\u0119zyka naturalnego. Mo\u017ce by\u0107 wykorzystywany do generowania tekstu, edycji tekstu, prowadzenia rozm\u00f3w z u\u017cytkownikami, tworzenia streszcze\u0144, t\u0142umaczenia i wielu innych zada\u0144. Jednak jego najwi\u0119kszym atutem jest zdolno\u015b\u0107 do pracy z d\u0142ugimi tekstami, co stanowi znacz\u0105cy post\u0119p w stosunku do istniej\u0105cych modeli j\u0119zykowych.<\/p>\n<h2>Czym LongLLaMA r\u00f3\u017cni si\u0119 od ChatGPT?<\/h2>\n<p>Warto r\u00f3wnie\u017c zaznaczy\u0107, \u017ce <strong>LongLLaMA<\/strong> r\u00f3\u017cni si\u0119 od <strong>ChatGPT<\/strong> nie tylko pod wzgl\u0119dem osi\u0105ganych wynik\u00f3w, ale tak\u017ce pod k\u0105tem dost\u0119pno\u015bci. Model ten jest dost\u0119pny publicznie i ka\u017cdy mo\u017ce pobra\u0107 go ze strony <strong>HuggingFace<\/strong> oraz modyfikowa\u0107 oprogramowanie. To otwiera drzwi do dalszych innowacji i dostosowywania modelu do r\u00f3\u017cnych zastosowa\u0144. W przeciwie\u0144stwie do tego, <strong>ChatGPT<\/strong> jest produktem komercyjnym i nie zosta\u0142 udost\u0119pniony publicznie.<\/p>\n<p>Podsumowuj\u0105c, opracowanie modelu <strong>LongLLaMA<\/strong> przez polskich naukowc\u00f3w stanowi istotny krok w przoduj\u0105cej dziedzinie sztucznej inteligencji. Ten model j\u0119zykowy o niezwyk\u0142ych mo\u017cliwo\u015bciach przetwarzania tekstu ma potencja\u0142 zmieni\u0107 spos\u00f3b, w jaki korzystamy z aplikacji i narz\u0119dzi opartych na sztucznej inteligencji. Jego zdolno\u015b\u0107 do pracy z d\u0142ugimi tekstami otwiera nowe perspektywy w dziedzinie analizy tekstu, generowania tre\u015bci i wielu innych obszarach. Warto \u015bledzi\u0107 rozw\u00f3j tego modelu, kt\u00f3ry mo\u017ce przyczyni\u0107 si\u0119 do dalszych prze\u0142om\u00f3w w dziedzinie przetwarzania j\u0119zyka naturalnego.<\/p>\n","protected":false},"excerpt":{"rendered":"W Polsce dosz\u0142o do prze\u0142omowego wydarzenia w dziedzinie sztucznej inteligencji i przetwarzania j\u0119zyka naturalnego. Zesp\u00f3\u0142 badaczy zwi\u0105zanych z&hellip;","protected":false},"author":60,"featured_media":201311,"comment_status":"open","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"csco_display_header_overlay":false,"csco_singular_sidebar":"","csco_page_header_type":"","csco_page_load_nextpost":"","csco_post_video_location":[],"csco_post_video_location_hash":"","csco_post_video_url":"","csco_post_video_bg_start_time":0,"csco_post_video_bg_end_time":0,"footnotes":""},"categories":[9666,4631],"tags":[13884,6236,4132],"class_list":{"0":"post-201310","1":"post","2":"type-post","3":"status-publish","4":"format-standard","5":"has-post-thumbnail","7":"category-technologie","8":"category-trendy","9":"tag-chatgpt","10":"tag-innowacje","11":"tag-sztuczna-inteligencja","12":"cs-entry","13":"cs-video-wrap"},"_links":{"self":[{"href":"https:\/\/mediarun.com\/pl\/wp-json\/wp\/v2\/posts\/201310","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/mediarun.com\/pl\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/mediarun.com\/pl\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/mediarun.com\/pl\/wp-json\/wp\/v2\/users\/60"}],"replies":[{"embeddable":true,"href":"https:\/\/mediarun.com\/pl\/wp-json\/wp\/v2\/comments?post=201310"}],"version-history":[{"count":0,"href":"https:\/\/mediarun.com\/pl\/wp-json\/wp\/v2\/posts\/201310\/revisions"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/mediarun.com\/pl\/wp-json\/wp\/v2\/media\/201311"}],"wp:attachment":[{"href":"https:\/\/mediarun.com\/pl\/wp-json\/wp\/v2\/media?parent=201310"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/mediarun.com\/pl\/wp-json\/wp\/v2\/categories?post=201310"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/mediarun.com\/pl\/wp-json\/wp\/v2\/tags?post=201310"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}