현재 시점의 AI 기술개발 상황 (2024년 9월 현재)




지난 포스팅, AI: 현실화된 SF 개념 (SF가 미리 본 미래)에서 SF가 예견한 AI의 등장을 이야기한 바 있다.

AI : 현실화된 SF 개념 (SF가 미리 본 미래)

AI는 이미 많은 분야에서 우리의 삶에 영향을 미치고 있으며, 이 기술의 발전과 더불어 다양한 이슈와 한계, 그리고 미래 가능성에 대해 알아볼 필요가 있다.

오늘은 지난 시간 AI의 개념 소개에 이어, 우리가 보다 현실적으로 체감하고 이해하기 쉬운 내용인 “현재시점의 AI 기술개발 상황“을 소개하고자 한다.

AI

AI 개발의 현 주소

 

 

1.  AI와 관련한 이슈들

        1)  2016년 :   마이크로소프트의 AI 챗봇 “Tay” 사건

           2016년, 마이크로소프트는 트위터에서 사용자와 소통하는 AI 챗봇 “Tay”를 출시했다. Tay는 대화를 통해 사람들과 소통하며 학습하도록 설계되었으나, 출시 몇 시간 만에 인종차별적이고 성차별적인 발언을 내뱉으며 큰 논란을 일으켰다. 이는 Tay가 트위터 사용자들로부터 부정적이고 공격적인 언어를 학습한 결과였다. 이 사건은 AI 학습 과정에서의 윤리적 문제를 적나라하게 드러냈고, 마이크로소프트는 Tay를 긴급히 오프라인으로 전환할 수밖에 없었다.

        2)  2020년 :   GPT-3 사건

           OpenAI의 GPT-3 모델도 비슷한 문제를 겪었다. 이 모델은 특정 질문에 대해 인종차별적이거나 성차별적인 답변을 제공하면서 논란이 발생했다. 이는 GPT-3가 훈련된 방대한 데이터셋 내에 존재하는 편향된 정보를 그대로 학습했기 때문이다. 이 사건은 AI가 주어진 데이터를 그대로 학습하면서 발생할 수 있는 위험성을 다시금 환기시켰다.

        3)  2022년 :   ChatGPT 서비스 공식 런칭

           2022년 ChatGPT가 공식 출시된 이후, AI에 대한 대중의 관심은 폭발적으로 증가했다. ChatGPT는 사용자의 질문에 대한 답변을 제공하고, 다양한 주제에 대해 대화하며, 창의적인 글쓰기 작업까지 돕는 능력을 선보이며 사람들의 일상에 큰 변화를 가져왔다. AI의 편리함과 효율성 덕분에 전문가뿐만 아니라 일반 사용자들까지도 이 기술의 발전에 열광하게 되었다. 이러한 대화형 AI의 확산은 AI가 일상생활에 얼마나 큰 영향을 미칠 수 있는지를 단적으로 보여주는 사례라 할 수 있다.

 

 

2.  (현재까지의) AI 개발 성과와 한계, 발전 가능성

         AI는 여러 분야에서 획기적인 성과를 보여주었지만, 여전히 해결해야 할 한계도 존재한다. AI가 어떤 성과를 거두었는지, 또 어떤 한계를 지니고 있는지 살펴보자.

< 개발 성과 >

                   •  자연어 처리(NLP) :  AI는 인간의 언어를 이해하고 처리하는 능력이 크게 발전했다. ChatGPT와 같은 대화형 AI는 자연스러운 언어로 사용자와 소통하며, 문맥을 이해하는 능력을 갖추게 되었다.

                   •  의료 분야 :  AI는 질병 진단, 치료 계획, 유전자 분석 등 의료 분야에서 혁신적인 변화를 가져왔다. 예를 들어, AI 기반의 의료 이미징 분석은 암 조기 발견율을 획기적으로 높였으며, 이러한 성과는 의료 현장에서의 AI 활용 가능성을 보여준다.

                   •  자동화 :  AI는 제조업에서의 생산성 향상, 자율주행차의 발전, 물류 및 배송 시스템의 자동화 등에 중요한 역할을 수행하고 있다. 특히, 제조업에서의 로봇 자동화와 자율주행 기술은 AI의 성과를 대표하는 예다.

< 한계 >

                   •  윤리적 문제 :  AI는 여전히 편향된 데이터를 학습할 위험이 있으며, 이로 인해 인종차별적, 성차별적 발언이나 결정을 내릴 수 있다. 이는 AI 개발에서 가장 큰 도전 과제 중 하나로, 윤리적 AI 개발이 필요한 이유이기도 하다.

                   •  데이터 의존성 :  AI의 성능은 학습에 사용되는 데이터의 질과 양에 크게 의존한다. 불완전하거나 편향된 데이터는 AI의 판단에 부정적인 영향을 미칠 수 있다.

                   •  결정과정 누락 가능성 :  AI의 결정 과정은 종종 “블랙박스”로 여겨지며, 이를 이해하고 설명하는 것이 어렵다. 이는 AI의 신뢰성과 투명성 문제로 이어지며, AI가 실제로 어떻게 작동하는지에 대한 이해를 어렵게 만든다.

< 발전 가능성 >

                   AI는 앞으로도 더 진화할 가능성이 크다. 특히, 감정 분석, 상황 인식, 윤리적 고려 등을 포함한 복잡한 모델로 발전할 것으로 예상되며, 이러한 발전은 AI가 인간의 판단과 더욱 유사한 결정을 내릴 수 있도록 할 것이다. 하지만, AI가 인간처럼 완전한 판단을 내릴 수 있을지에 대해서는 여전히 논의가 필요하다. AI의 진화 과정에서 윤리적 고려와 책임 있는 개발이 필수적이며, 이를 통해 AI의 사회적 역할이 긍정적으로 발전할 수 있도록 해야 할 것이다.

 

 

3.  AI 작동 개념

         AI의 작동 원리는 크게 “인코딩(Encoding)”과 “디코딩(Decoding)”으로 나뉜다.

                인코딩(Encoding) :

                         AI는 입력된 정보를 분석하고 이해하는 과정에서 인코딩을 수행한다. 이 과정에서 AI는 텍스트, 이미지, 음성 등 다양한 데이터를 숫자 형태의 벡터로 변환한다. 이는 AI가 다양한 입력 데이터를 처리하고 학습할 수 있도록 돕는 중요한 단계이다. 비유하자면, 인코딩은 책의 내용을 디지털화하는 과정과 유사하다. 책에 쓰인 글자들을 컴퓨터가 이해할 수 있는 데이터로 변환하는 것과 같다.

                디코딩(Decoding) :

                         디코딩은 인코딩된 데이터를 바탕으로 원하는 출력을 생성하는 과정이다. 예를 들어, 대화형 AI에서 디코딩은 사용자 질문에 대한 적절한 답변을 생성하는 역할을 한다. 이 과정에서 AI는 학습된 패턴을 기반으로 최적의 답변을 생성하며, 이를 통해 사용자에게 유용한 정보를 제공하게 된다. 이는 디지털화된 책의 내용을 다시 사람이 읽을 수 있는 형태로 출력하는 과정과 유사하다.

         AI가 인코딩과 디코딩을 통해 방대한 데이터들을 검색해서 패턴을 인식하고 유의미한 정보를 생성하는 방식…. 이게 바로 AI의 핵심적인 작동 원리다.

 

 

4.  (현재) 일반인들이 사용할 수 있는 AI 모델

         현재 마이클을 포함한 우리 일반인이 사용할 수 있는 AI 모델은, 크게 “대화형 AI“, “그림 생성 AI“, “동영상 제작 AI“로 구분할 수 있다.

          가장 우수하다고 평가받고 있는 AI 모델들의 특징을 소개한다.

 

              1)  대화형 AI

                     ChatGPT (OpenAI) :

                            •  특징 :  GPT-4 기반으로 방대한 텍스트 데이터를 학습해 다양한 주제에 대해 깊이 있는 답변을 제공한다.

                            •  비용 :  무료 버전과 월 $20의 유료 버전이 있으며, 유료 버전은 더 빠른 응답과 고급 기능을 제공한다.

                            •  장점 :  자연스러운 대화와 다양한 주제에 대한 깊이 있는 답변.

                            •  단점 :  가끔 불필요하게 긴 답변이나 잘못된 정보를 제공할 수 있다.

chatGPT
(ChatGPT 사이트 링크)

                     Claude (Anthropic) :

                            •  특징 :  안정성과 윤리적 대화에 중점을 두어 개발된 AI로, 몇몇 벤치마크에서 ChatGPT를 능가하는 점수를 받았다.

                            •  비용 :  무료 버전 제공, 유료 버전은 사용자 요구에 따라 차별화된 기능을 제공한다.

                            •  장점 :  신뢰성 있는 답변, 윤리적이고 안전한 대화.

                            •  단점 :  기능이 제한적일 수 있으며, 깊이 있는 답변 제공에는 한계가 있을 수 있다.

Claude
(Clalude 사이트 링크)

                     Gemini (Google) :

                            •  특징 :  실시간 검색과 연동되어 최신 정보를 제공하는 대화형 AI. 구글 바드로 알려져 있었다.

                            •  비용 :  무료로 사용 가능하며, Google 계정만 있으면 접근 가능하다.

                            •  장점 :  최신 정보 제공, Google 서비스와의 연동.

                            •  단점 :  제한된 기능과 덜 정교한 답변.

Google Gemini
(구글 Gemini 사이트 링크)

              2)  그림 생성 AI

                     MidJourney :

                            •  특징 :  텍스트 기반으로 예술적 이미지를 생성하는 AI로, 창의적이고 고품질의 이미지를 생성하는 데 특화되어 있다.

                            •  비용 :  무료 버전은 제한된 사용이 가능하며, 유료 버전은 월 $10부터 시작한다.

                            •  장점 :  예술적 이미지 생성, 다양한 스타일의 이미지 지원.

                            •   단점 :  텍스트에 따라 이미지의 품질이 달라질 수 있으며, 이미지 생성 시간이 다소 걸릴 수 있다.

Midjourney
(미드저니 사이트 링크)

                    Google Imagen 3 :

                            •  특징 :  고해상도 이미지를 생성하며, 텍스트의 세부적인 의미를 정확하게 반영한다. 특히 자연어를 이해하는 능력이 매우 높다고 알려져 있다.

                            •  비용 :  현재 연구 및 개발 단계에서 제한적으로 제공되며, 상용화에 대한 정보는 아직 공개되지 않았다.

                            •  장점 :  매우 높은 디테일과 사실성을 가진 이미지 생성. 다양한 창의적인 스타일과 시각적 표현 가능.

                            •   단점 :  아직 상용화되지 않았으며, 일반 사용자가 접근하기 어려운 상태이다.

Google Imagen3
(구글 Imagen 3 사이트 링크)

                     DALL-E 2 (OpenAI) :

                            •  특징 :  DALL-E 2는 사용자가 입력한 텍스트 설명을 바탕으로 이미지를 생성하는 AI로, 매우 사실적이거나 독창적인 이미지를 생성할 수 있다.

                            •  비용 :  무료 버전이 제공되며, 이미지 생성에 따라 크레딧을 소모하는 구조. 추가 크레딧은 별도로 구매할 수 있다.

                            •  장점 :  높은 이미지 품질, 창의적이고 다양한 스타일의 이미지 생성.

                            •  단점 :  크레딧 제도에 따라 사용량이 제한될 수 있다.

DALL-E2
(오픈AI 달리 2 사이트 링크)

                     Stable Diffusion :

                            •  특징 :  Stable Diffusion은 오픈 소스 AI로, 사용자가 직접 설치하여 사용할 수 있으며, 이미지 생성에 있어 높은 자유도를 제공한다.

                            •  비용 :  무료로 사용할 수 있지만, 설치 및 사용에 기술적 지식이 필요할 수 있다.

                            •  장점 :  사용자가 커스터마이즈할 수 있는 높은 자유도, 커뮤니티 지원.

                            •  단점 :  설치와 사용이 다소 복잡할 수 있으며, GPU 자원이 필요하다.

Stable Diffusion
(스테이블 디퓨젼 사이트 링크)

              3) 동영상 제작 AI

                     Runway Gen-3 :

                            •  특징 :  단순한 텍스트를 바탕으로 고품질의 동영상을 자동으로 생성하며, 특히 영화 제작, 광고, 마케팅 등에서 효율적으로 사용될 수 있으며, 복잡한 영상 편집 작업을 AI가 자동으로 처리.

                            •  비용 :  현재 Runway Gen-3는 상업용 라이선스 모델로 제공되며, 사용 목적에 따라 다양한 요금제가 존재한다.

                            •  장점 :  빠른 동영상 생성 속도와 높은 퀄리티. 창의적 동영상 제작에 적합하며, 다양한 사용자 정의 옵션을 제공.

                            •  단점 :  고급 기능을 사용하기 위해서는 높은 비용이 필요할 수 있으며, 사용자가 완전히 컨트롤할 수 없는 부분이 존재.

Runway Gen3
(런어웨이 Gen 3 사이트 링크)

                     Synthesia :

                            •  특징 :  Synthesia는 텍스트를 입력하면 AI 기반으로 아바타가 해당 텍스트를 말하며 동영상을 제작해 주는 AI이다. 주로 마케팅, 교육 동영상 제작에 많이 사용된다.

                            •  비용 :  개인 사용자는 월 $30의 비용이 발생하며, 기업 고객을 위한 맞춤형 요금제가 있다.

                            •  장점 :  텍스트 입력만으로 쉽게 동영상 제작, 다양한 아바타와 언어 지원.

                            •  단점 :  맞춤형 동영상 제작에는 한계가 있으며, 템플릿이 고정적일 수 있다.

Synthesia
(Synthesia 사이트 링크)

                     Pictory :

                            •  특징 :  Pictory는 블로그 글, 스크립트 등을 입력하면 자동으로 동영상을 생성해 주는 AI 도구이다. 비디오 클립, 음악, 텍스트 오버레이 등을 자동으로 조합해 동영상을 제작한다.

                            •  비용 :  무료 버전이 있으며, 유료 버전은 월 $19부터 시작한다.

                            •  장점 :  사용하기 쉬운 인터페이스, 다양한 템플릿 제공.

                            •  단점 :  텍스트 기반으로 제작된 동영상의 품질이 일정하지 않을 수 있다.

Pictory
(픽토리 사이트 링크)

                     Lumen5 :

                            •  특징 :  Lumen5는 텍스트를 자동으로 요약하고, 이를 바탕으로 동영상을 생성하는 AI 도구. 블로그 글, 기사 등을 시각적인 콘텐츠로 변환하는 데 유용하다.

                            •  비용 :  무료 플랜이 있으며, 유료 플랜은 월 $29부터 시작한다.

                            •  장점 :  블로그 글이나 기사를 손쉽게 동영상으로 변환 가능, 다양한 템플릿 제공.

                            •  단점 :  영상 퀄리티가 고정적이며, 템플릿의 한계로 인한 창의성 제한이 있을 수 있다.

Lumen5
(루멘 5 사이트 링크)

 

 

5.  애플의 AI 개발 지향점 소개

         애플이 말하는 “기기에 있는 독립적 AI” 개념은 프라이버시 보호와 에너지 효율성에 중점을 둔 혁신적인 접근법일 수 있다.

         이 개념은 데이터를 클라우드로 보내지 않고, 사용자의 기기 내에서 AI 처리를 수행하는 것을 의미한다. 이를 통해 사용자는 자신의 데이터를 외부 서버로 전송할 필요 없이 AI 기능을 이용할 수 있다.

             < 장점 >

                          1.  프라이버시 보호 :

                               •  애플은 사용자 프라이버시를 강조하는 기업으로 유명하다. 기기 내에서 AI 처리를 수행함으로써, 사용자의 개인 데이터가 클라우드로 전송되지 않기 때문에, 개인정보 유출의 위험을 크게 줄일 수 있다. 이는 특히 민감한 정보나 개인적 데이터가 포함된 AI 작업에서 중요한 장점으로 작용될 수 있다.

                          2.  에너지 효율성 :

                               • 기기 내에서 AI 처리를 하면 클라우드와의 지속적인 데이터 통신이 필요 없기 때문에, 에너지 효율성이 높아질 수 있다. 이는 배터리 수명 연장에도 긍정적인 영향을 미칠 수 있으며, 특히 모바일 기기에서 중요한 요소이다.

                          3.  실시간 처리 및 응답성 :

                               • 기기 내 AI는 네트워크 연결 없이도 실시간으로 작동할 수 있어, 응답 시간이 빨라지고, 오프라인 상태에서도 AI 기능을 사용할 수 있다는 장점이 있다. 이는 예를 들어, 카메라 앱의 실시간 이미지 처리나 음성 인식 같은 기능에서 유용하게 활용될 수 있다.

             < 단점 및 문제점 >

                            기기 내 AI는 제한된 하드웨어 자원(예: CPU, GPU, 메모리)을 사용해야 하므로, 복잡한 AI 모델을 실시간으로 처리하는 데 있어 한계가 있다.

                            이를 극복하기 위해, 애플은 효율적인 알고리즘과 최적화된 하드웨어…… (예를 들어, 애플의 A시리즈 칩에는 뉴럴 엔진이 내장되어 있어 AI 처리를 가속화할 수 있다고 한다)……를 지속적으로 개발하고 있다. 하지만 기본적으로 개별 기기의 하드웨어에서 ChatGPT 같은 대규모 언어 모델을 실시간으로 처리하는 데는 한계가 있다.

                            ChatGPT와 같은 모델은 수억 개의 파라미터를 가지고 있으며, 이를 실행하기 위해 고성능 서버와 대규모 데이터 센터에서 작동한다. 이러한 환경에서 AI 모델은 매우 빠르게 작동할 수 있으며, 복잡한 언어 처리 작업을 실시간으로 수행하게 되는데, 일반적인 소비자 기기에서 이러한 성능을 구현한다는 것은 아무리 하드웨어가 발전한다고 하더라도 현실적으로 어려운 일이다.

                            마이클이 애플이 AI 부문에 대한 준비가 부족하다고 느끼는 부분이 바로 이 지점이다.

애플: 시대를 초월하는 우아함과 혁신의 아이콘(1) 중에서    7.애플의 미래와 고민 part 참고

 

이번 포스팅도 여러분에게 도움이 되었으면 좋겠다.

마이클은 여러분에게 당부하고 싶다. 10대 20대 30대 40대 50대 60대 70대…. 당신이 어떤 세대이든 간에, 이제는 현실이 된 AI에 관심을 기울이고 익숙해지려 애써야 한다. 지금 우리 시대는 그런 시대다. 하지만 그게 숙제와 짐 같은 거라고 생각할 필요는 없다. 오히려 배울거 많다는 건 신나는 일이다.

 

 

이 게시물이 얼마나 유용했습니까?

평점을 매겨주세요.

평균 평점: 0 / 5. 투표수: 0

지금까지 투표한 사람이 없습니다. 가장 먼저 게시물을 평가해 보세요.

Leave a Comment

error: 우클릭할 수 없습니다.