이번엔 Right Leg 부분이다..! 이번껀 미리 확인을 해봤는데.. 다행히 이전 처럼.. 끼우기가 힘든 곳은 별로 없는 것 같다..!
그리고.. 다른 설명서 부분도 봤는데.. 이 정도라면.. 충분히 프레임만 수정하면 이건 무조건 가능할 것 같다고 생각되는 정도이다..! (아마도..)
아무튼!
이번 부분을 시작하기 전에.. Flange Bearing이 내가 이전 글에서 적지 않았다는 것을 찾았다.. Flange Bearing은 이 부분에서 사용되게 되는데.. 이전 글을 적을 때 같이 찾지 않았었다.. 그래서 방금 이 파일을 찾느라 조금 힘들었다..
일단 이렇게 생겼다..
베어링하고 혼쪽에 도면이 있는지 확인해봤는데.. 베어링이라면서 없다..
그래서 다른 곳을 다 찾아보니.. 하나 찾았다..
Frame 도면 쪽에서 찾았는데.. 2개 모양이 저 작은 사진으로 봤을 때 가장 비슷했다.. 그런데 보면 2개 중에 뭔지를 찾아야 하는데.. 뭐 적혀있다. MX 28이라고.. 그리고 다른 부품들 이름을 봤을 때 대부분 07로 끝나는데.. 그걸 본다면 알 수 있다는 것..!
이번 파트 부분에서는 대부분 조립대로 하면 되는거라서 딱히 말할 곳은 없지만.. 몇가지 않좋을 수 있는 부분이 있다..
일단 이 부분은.. 로봇의 발에 해당하는 부분이다.. 저기에 보면 나사를 넣고 반대쪽에서 너트로 고정하지 못한다..
만약 고정해버리면 분명.. 긁힐 것이 뻔하니..
그래서 저 부분은 만약 만든다면.. 인서트 너트로 해야할 것 같다..
저정도는 인서트 너트로 하면 잘 붙으니깐 오히려 좋을 수도 있을 것 같다..!
그리고 하면서 특이한게 보이는데.. 부품 목록을 봐도 그렇고.. 하나 파워 스위치 쪽 부품 빼고는 전부 LR 구분이 없다..!!
발판을 봐도 왼쪽 오른쪽에서 가능하도록 여러개 뚫려있다..
바이올로이드 조립할 때도 느낀거긴 하지만.. 양쪽에서도 다 쓸 수 있도록 만드는 것.. 뭔가.. 대단하고 신기하다고 느낀다..
그리고 이런 부분도 있는데 이 부분도 마찬가지로 보면 너트로 고정하지 않는다..
그래서 이 부분은 도데체 어떻게 해야할지 고민이다.. 이쪽 부품은 작고 저렴하니깐.. 그냥 구매하는 것도 방법일 것 같고..
안되면 여기도 인서트 너트로 되게 만들어야 할 것 같다..
그리고..
이번엔 여기에서 문제가 생겼다..!
저 32번.. 아마 내가 기억하는걸로는 케이블 고정할 때 쓰는걸로 기억하는데.. 내가 저거에 않좋은 추억이 있는게.. 바이올로이드 조립할 때 저걸 프레임에 끼우는데 바이올로이드는 플라스틱이다.. 그래서 한번 조립하면.. 플라스틱이 갈려있다.. 그래서 항상 안끼워지고 풀려버려서 굉장히 짜증났던 기억이 있는데.. 철제라면 진짜 좋을지도..
일단 눈으로 보이는 것은 정면에 2개 후면에 1개 나사가 보이고.. 나머지 나사들은 가려져있다..
그래도 알 수 있는건 직사각형이라는 것이고.. 각 4개의 나사를 사용하는걸로 추정이 된다..
그럼으로.. 아마도..
이곳이 PC를 장착하는 부분이 아닐까 싶다..
그러면 여기로 해서 스페이서 등을 먼저 끼운 후에 크기를 어림잡아서 보드 위치를 만들면 될 것 같다..
그리고 원래는 S6를 사용해서 고정하는 것이지만.. 이 부분에서는 Flat 나사를 사용하는 것 같다. 그럼으로 S10을 이용해서 해볼 것이다..! 어차피 둘다 길이는 4mm이다.
그렇게 하면.. 일단 이렇게 조립을 해볼 수 있다.. 그리고 저 나사 부분에 맞춰서 이번엔 메인 PC 부분을 어림잡아서 만들 것이다.
그 후
이렇게 스케치를 하고.. 2mm로 늘려서 만들어주면!
이렇게 조립할 수 있다..!
그러면 다음!
이번껀 파워 스위치 부분을 조립해볼 것이다. 원래 파워 스위치가 먼저 나와있긴 한데.. 메인보드가 중요해서 그걸 먼저 찾다보니.. 순서가 엇갈리긴 했지만.. 아무튼..
파워 스위치의 경우 9R 프레임을 이용한다고 한다.. 그래서 9R 프레임을 열어봤는데.. 어라?
분명 파일 이름은 9R 이라 되어있는데.. 모습이 전혀 다르다..
그래서 생각한게.. 설마.. 이것도 모양이 바뀌었나..? 하다가 예전에 대구 엑스코에 가서 봤던 Darwin OP 2가 생각난다.. 그 사진을 봤다.
음.. 여기에는 정상적으로.. 있다.. 그러면 설마 9L에 뭔가 있나..? 해서 봤는데..
진짜였다.. 음.. 왜 이름을 다르게 적어놓은거지..
아무튼 이것도 아까 했던 것과 비슷하게 스페이서 먼저 끼우고 프레임을 대충 어림잡아서 맞춰본다.. 파워 스위치의 규격이 제대로 나와있지 않기 때문에..
그렇게 해서.. 이렇게 만들었다..! 이 부분은 조금 나중에 완성했을 때 겉모습에서 보이는 부분이기 때문에.. 비슷하게 돌출 시켰다. 아무튼.. 저 판때기 부분도 2mm로 잡아서 하고 붙였다.
그리고 이제 5번 프레임과 모터를 붙일 차례다..
그런데 설명서에 이상한 점이 하나 있다..
나사를 끼울 때 너트를 끼우는 부분에 볼트로 고정시키는 장면이 나온다..
아마 이 방법이 가능할려면 5번 프레임의 모터 끼우는 저 부분에 나사선이 있거나 해야한다. 아니면 반대쪽에 너트를 끼운다거나.. 그런데 그런 장면이 없다..
아마도 잘못 된 방법으로 설명서를 만들었거나.. 5번 프레임에 나사선이 있거나.. 둘중 하나일 것 같다.. 아마 나사선이 있을 것 같다고 생각된다..
근데 나의 경우는 무조건 프레임들은 3D 프린터로 출력하기에 나사선을 넣을 수는 있으니.. 따로 출력 후 나사선을 넣거나 넣는다 하더라도 쉽게 부숴질 것이다.. (저건 철제라서 상관없겠지만..)
그래서 나는 이 부분을 그냥 너트 끼우는 곳에 너트 끼우고 반대편에서 나사를 끼우는 방법으로 했다.
이런식으로 했다. 나사 같은 경우 원래는 S17를 이용하지만.. S17의 경우 10mm 이다.. 약간 부족하다.. 그래서 S18를 새로 추가했다. Hex M2.5 * 12로 12mm 짜리를 추가해서 끼웠더니.. 완벽하게 딱 맞다..
그리고 나중에 진짜 조립해야할 때는 보드는 나중에 끼우고 저걸 먼저 끼워야 하긴 할 것 같다..
물론 이렇게 한다면 단점은 약간이라도 풀리거나 하면 거의 완전 분해 후에 끼워야 한다는 단점이 있지만.. 어쩔 수 없다..
아니면 인서트 너트를 끼우는 방법도 있긴 할텐데.. 저쪽에는 약할 것이다.. 암튼 그런 이유로.. 하기가 어렵다는 점..
그래서 저런 방식으로 맞췄다.
마찬가지로 여기서도 베어링 부분은 필요없기 때문에 모터에서 베어링 부분은 숨겼다..
그리고 이 부분이다.. 여기서부터.. 좀 망했다고 느꼈다..
왜냐하면.. 이전에서 말했던.. 프레임에 나사선이 있다고 했던게.. 진짜라는 것을..
일단 S14 구멍을 확인해보니.. 나사보다 약간 작다.. 즉.. 나사선이 있거나 아니면 끼우면서 강하게 조여서 나사선을 강제로 만들면서 끼운다던가.. 해야하는 것 같다..
그리고 보드를 고정시키는 부분과 겹쳐버려서 진짜로 겹쳤다..
뭐.. 어쩔 수 없다.. 이 부분은 나중에 프레임을 수정할 때 내가 사용할 보드 사이즈에 맞춰서 수정하면 되는 부분이니깐.. 딱히 상관은 없지만.. 조금 불편하다.. 암튼 원래 저기에는 너트를 끼우는건 아니긴 한데.. 프레임을 플라스틱으로 출력하는 경우 나사선을 만들기 어려우니.. 저런식으로 너트로 고정할 수 있도록 했다. (굉장히 불편해하는 중..)
그리고 이 부분도.. 마찬가지이다.. 일단 S10의 경우 Flat M2.5 * 4mm 나사이다.. 근데 저것도 프레임의 나사선에 끼우도록 되어있으므로 나사 길이가 맞지 않는다..
그래서 S19를 추가했다. S19 Flat M2.5 * 6mm로 .. 그래서 6mm 나사를 끼우니깐 완벽하게 맞았다.. 물론 반대편에 너트도 끼웠다.
이걸 하다보니.. 생각난게.. 어차피 Darwin OP 1 처럼 그냥 CNC로 철을 잘라서 만들까 생각했는데.. 만약 그렇게 되면.. 조립은 쉽겠지만.. Darwin OP 2 용은 2D로 제공되지도 않고.. 무거우면 또 움직이질 않을테니.. 그냥 모델을 수정해서 3D 프린터로 출력하는 방안으로 밖에 할 수가 없을 듯 하긴 하다..
암튼 그렇게 해서
이 부분도 끼웠다.
이전에 본게.. 너트 사용량이 적던데.. 설마.. 내가 생각하는 그런 일이 엄청 벌어지진 않겠지..? 라고 생각하는데.. 제발.. 정 안되면 인서트 너트라도 찾아야지 뭐..
암튼 모터 부분은 설명서에 적힌 것 처럼 끼우고..
이 부분을 조립해야하는데.. 이 부분 같은 경우 저 동그란건 내가 위에 올린 사진을 봤을 때는 그냥 손잡이로 돌려서 배터리 넣는 부분에서 배터리를 바꿀 수 있게 한 것 같다. 근데 어쨋든 저 동그란 나사 같은건 같이 포함되어있지는 않고.. 일반 프레임만 포함되어있는데.. 암튼 저걸 끼우면
그렇게 해서 이렇게 필요한걸 다운로드 했다. 참고로 저기에 SU1, SU2, SU3는 아무리 찾아봐도 내가 원하는 규격이 없어서.. 그냥 만들기가 쉬운거라 Fusion 360으로 만들었다. 그리고 S1 저거는.. 무슨 나사인지 적혀있지 않고.. 작은 나사이다 보니.. 잘 없다.. 그래서 그냥 일단 Hex 나사로 다운로드 하기는 했다..
암튼 저것보다 더 중요한게 있는데.. 모터에 장착할 베어링과 혼 이다.. 기본적으로 Robotis에서 제공하는 MX 28T의 3D 파일에는 혼과 베어링이 없다.. 그래서 직접 추가해야한다..
여기에서 찾을 수 있다. 베어링 쪽에도 다운로드 할 수 있는게 있으니.. 거기도 확인해야한다..
암튼 저 구성품들을 보고 필요한 파일들을 찾아서 다운로드 하면 된다. 추가적으로 BEARING MF106ZZ 파일은 찾을 수가 없는데.. 이건 그냥 웹페이지에서 다운로드 하면 된다..
그렇게 해서 다운로드 해보면
이렇게 얻을 수 있다..!
그리고 Fusion에 모두 업로드 한다.. 그러면 준비 완료!
Upper Chest 가상 조립
일단 모터에 혼과 베어링 부터 장착한다.
이렇게 장착한다. 조립하는건 딱히 어렵지 않아서.. 대충 대충 넘어갈 것이다.
암튼 베어링과 혼 쪽에는 돌아가게 해야하는 부분은 있어서 그곳은 회전으로 돌아가게 했다.
그리고 이제 Upper Chest 부분을 조립한다..! 조립할 때는 전부 설명서와 똑같이 나사와 너트를 이용해서 조립을 하고 추가적으로 모델링이나 필요한 것들이 있을 때만 그거에 대한 것들을 설명할 것이다..!
암튼.. 설명서는!
이렇다.
굉장히 간단하다..
암튼 저것에 대한걸 전부 조립하게 되면.. 이렇게 나온다..!
보이는 것 처럼 나사와 너트들도 전부 장착했다. 장착할 때 설명서에는 그림으로만 나오는게 하나 있는데.. 3개의 모터에서는 모터의 베어링 쪽은 사용되지 않으므로 베어링 부분은 제거해야한다. 하지만 Fusion에선 이미 조립한걸 제거할려면 귀찮은걸 해야해서 그냥 모습만 안보이게로 바꿨다.
암튼 여기에서 따로 한 것은.. 서브 컨트롤러이다. Darwin OP 2에는 CM 740 이라는 컨트롤러를 사용하는데.. Darwin OP 1은 CM 730을 사용한다. CM 740과 CM 730의 차이는 성능 차이도 있지만 모양 차이도 있다.
CM 730
CM 740
이렇게 모양이 다르다. 그렇기에 설명서에 보면
이렇게 1-2-2 그림에서 보드 끼우는 곳이 넓게 보이는 반면.. 실제로는
좁다. 암튼 그 이유는 위에서 말한 것 처럼 보드의 크기가 달라서 그렇다.
그리고 추가적으로 센서나 보드나 이런 것들은 3D 파일이 없다..
그런데 나는 최대한 비슷하게 만드는걸 목표로 하기 때문에 그냥 대충 크기 맞춰서 만들었다.
이렇게..
그렇게 해서 이렇게 2mm로 해서 만들었다.
그리고 안테나와 안테나 커넥터 들도 있는데.. 그거는 만들기가 어렵기도 하고 안쪽이라 잘 안보이기에 그냥 만들지는 않았다.
나는 현재 대학교 휴학을 했기 때문에 해보고 싶은 프로젝트를 모두 해보기로 했다. 그러다 보니 한번에 여러개의 프로젝트를 하게 되었는데.. 그 때문에 과연 기간 내에 진짜로 제작할 수 있을지는 모르겠지만.. 일단 도전해볼려고 한다..!
일단 Darwin OP 2를 제작해보는 것인데.. 내가 Darwin OP 1을 처음 본 것이 2012년 여수 엑스포에서 로봇관의 축구하는 로봇에서 처음으로 봤었다. 아마 7살 이였을 텐데.. 아직도 기억에 남는다.. (근데 당시에 왜 Nao 로봇 있었으면서 안보여준거지..)
Darwin OP는 어릴 때 부터 굉장히 가지고 싶던 로봇이다.. 예전에 로봇을 어딘가 판매 사이트에서 판매하는걸 본적도 있는데.. 당시에 내가 본 가격은 2000만원이였다.. (초등학교 저학년 때 본 것..) 그래서 구매하지는 못했지만.. 언젠가 만들어보거나 구매해보기로 마음을 먹었었다.. 나중에 부자가 된다면..
그렇지만! 현재는 구매는 못해도 제작은 할 수 있을 것 같다..! 아마 100만원 이내로.. 가능하지 않을까 라는 생각.. 아무튼 그때 본 Darwin OP 1 (축구 로봇)이 아닌 Darwin OP 2를 제작해볼려 한다..!
자료 조사
일단 내가 아는 정보로는 Darwin OP 1과 Darwin OP 2는 하드웨어 정도만 바뀌고 외형이나 프레임은 거의 차이가 없는 것으로 알고 있다.. (그런데 도데체 왜 OP 3는 저렇게 생긴걸까.. 음..)
그리고 모터는 Darwin OP 1이 MX 28, Darwin OP 2가 MX 28T로 각각 20개씩 쓰이는 것으로 알고 있다..!
가격은 대충 모터가 개당 26만원.. 그래서 이 프로젝트에는 사용하지 못한다..! 적어도 모터만 500만원 이상이 들게 된다..!
그렇기 때문에.. 나는 예전에 바이올로이드를 구매하면서 들어있던 AX 12A 모터를 이용할 것이다..! 참고로 AX 12A 모터는 총 18개 까지만 들어있어서 2개는 추가로 사야한다..
그런데 MX 28T를 그대로 AX 12A로 바로 변경할 수는 없다.. 왜냐하면..
이건 Robotis 다운로드 센터에 있는 모터 3D 파일을 다운 받아서 3D 프린터로 출력해본 것인데..
눈으로 봐도 전혀 크기가 안맞는 것을 볼 수 있다.. 세로와 높이는 비슷한데.. 가로 크기가 좀 다르고 나사를 끼우는 부분도 전혀 다르게 생겼다.
그래서 실제로 만들 때는 아마도 프레임을 전체적으로 바꿔야 할 것이다..
물론 AX 12A에 추가로 뭔가를 장착해서 MX 28T 모양에 맞게 바꿀 수 있을까? 라는 생각도 하긴 했었다. 그런데 비교를 해보니 AX 12A의 커버를 뜯어서 수정하지 않는 이상 거의 불가능할 것 같다고 판단되었다.. 가로 크기가 안맞아서 나사가 들어가는 곳이 애매해진다.. 그리고 커버에 추가로 뭔가를 장착해서 한다면 약간 부실하기도 할 것이다..
그리고 제일 신경 쓰이는게 있는데.. 왜 모터가 비싼 MX 28T 일까 이다.. 성능을 보니 아마도 토크, 해상도 등 지원하는 것들이 더 좋기 때문에 그럴 것이라고 생각하기는 하는데.. 토크 문제라면.. 이 프로젝트를 하는 의미가 없어지긴 한다.. 왜냐하면 만들었는데 힘이 부족해서 움직이기가 힘들어져서 작동을 잘 안한다던가 할 수도 있으니깐..
그래도 다행인 것이 있다. 내가 알기론 Darwin OP 2의 프레임은 모두 철제로 알고 있는데 나는 3D 프린터로 출력할꺼라서 가볍다는 점이다!! 게다가 바이올로이드가 프레임이 플라스틱인데 잘 움직이니깐.. 아마도 진짜로 가능은 할 것 같다고 생각된다..!
그리고 한가지 최악인 점은.. 모터, 프레임, 프레임 스킨 등은 아직도 판매하거나 만들 수 있으니 상관이 없지만.. 더 이상 판매하지 않는건 하드웨어 들이다.. CM 740이나 다른 나머지 하드웨어들이 더 이상 판매하지를 않는다.. 뭐 그래도 이거라면 상관은 없을 듯 하다.. 어차피 프레임을 바꿀꺼니깐.. 다른 하드웨어를 넣으면 되서.. 아마도 괜찮지 않을까 싶다..!
암튼 우선 Darwin OP는 모든게 오픈소스로 되어있다. OP도 오픈 플랫폼이다..
데니스 홍이 개발한 후에 오픈소스로 풀어버린 것.. 굉장하긴 하다..
필요한 파일 다운로드
암튼 그렇기 때문에 Darwin OP에 대한 모든 것을 다운해야한다..! 모델 파일, 소프트웨어 등등 전부 찾아야 한다..
다른 깃헙들도 있다. 저기는 아마도 Darwin OP에 사용되는 소프트웨어나 이런 것 같은데.. 뭐 지금은 중요하지 않다.. 일단 로봇 부터 모델링 하고 제작해야하니..!!
암튼 저 위 깃허브를 들어가보면 OP, OP2, OP3에 대한 파일들이 전부 있는데.. 나는 OP2만 필요하니 OP2로 들어가보면..
이렇게 있다. 여기에서 제일 필요한건 Hardware 폴더! 들어가보면 Electronics 폴더와 Mechanics 폴더가 있는데 내가 필요한건 Mechanics 폴더이다..! Electronics 폴더는 로봇의 컴퓨터나 센서 정보들이 들어가있는거..
암튼.. 저기에 들어가보면..!
드디어 필요했던 파일들을 볼 수 있다..!
여기에서 내가 진짜로 필요한건 "ROBOTIS OP2 Part Files.zip", "ROBOTIS-OP2_Skin_STP.zip", "DARwIn OP Assembly Manual.pdf" 정도 이다..
암튼 이렇게 자료 조사는 끝났다..!
이제는 가상으로 Darwin OP 2를 제작해보고.. 어떤 원리인지 등등을 확인한 후 AX 12A 전용 프레임으로 변경해보는 것이 이 프로젝트의 최종 목표다..!! (아마도 군대 가기 전까지 끝내는건 무리일 가능성이 제일 높다..)
특이한 점
그리고 한가지 특이한 점도 있다..
파일을 둘러보다가 "DARwIn OP Part Files.zip" 파일이 있는데.. 이걸 압축 풀어보면..
이렇게 2개의 폴더가 있다. 2D와 3D가 있다는 것이다.. 3D는 이해가 가는데.. 2D는 왜일까 싶어서 봤더니..
2D로 출력 가능하도록 만들어 뒀다는 것이다..
이걸 보자마자 여러 생각이 들었다. 데니스 홍이 Darwin OP를 개발하고 여러 연구소에서 요청이 들어와서 오픈 소스로 풀었다고 알고 있었는데.. 그것 때문에 2D 버전으로도 조립 가능하게 만든걸까? 아니면 3D 제조 비용이 비싸서 2D로도 제작할 수 있도록 만든 것인가? 등 여러 생각이 들었다..
아무튼.. 진짜 대단하다고 느꼈다. 나 같은 경우만 해도.. 예전부터 이건 내가 힘들게 습득했고 내가 알아낸거니깐 다른 사람들한테는 절대 안알려줄꺼야! 라고 생각했던 생각이 난다.. (이미 다른 곳에서 다 개발 됬을텐데.. 그런 생각을 한게 지금도 후회되기도 한다..)
암튼.. 힘들게 개발한걸 오픈소스로 풀었다는 것도 대단하지만.. 여기에서 제작하는 사람들을 위한 배려까지.. 이건 완전 나한테는 넘사벽인 것 같다.. (미래에는 나도 그럴 수 있을까..)
참고로 접히는 부분에는 규격에 맞게 틈이 정확하게 있고.. 심지어.. "DARwIn OP Fabrication Manual.pdf" 이 PDF 파일에는..
어떤 방법으로 휘어야 하는지.. 어떤 도구를 써야하는지.. 어떻게 부품을 만들어야 하는지.. 어떻게 조립해야하는지.. 2D 만을 위한 상세한 방법들이 나와있다..
어릴 때는 단순히 만들거나 사고 싶다라는 단순한 생각만 들었는데.. 이젠 찾아보면 찾아볼 수록.. 이 로봇을 개발하고 오픈소스로 푼 것이 얼마나 힘들고 얼마나 대단한지.. 이제야 알게 되었다..
나도 언젠가.. 이런 로봇 개발자가 될 수 있을까.. 흐음..
암튼..! 이제 자료조사는 전부 끝났으니.. 다음 부터는 가상으로 조립해볼 것이다..!
그 이후에는 AX 12A 모터로 대체하는 작업을 할 것인데.. 만약 아직도 내 기술이 부족해서 못할 것 같다고 판단이 되면.. 그냥 3D 프린터로 출력하게 목각 인형으로라도 가지고 놀아야 겠다..!!
아 마지막으로.. 내가 AX 12A로 만들고 싶어서 예전에 엄청 검색을 해봤는데.. MX 28T를 다른 AX 12A나 이런걸로 대체해서 만들 순 없는지에 대한 글은 몇개 보았는데.. 진짜로 AX 12A로 만든 글은 어디에서도 보지를 못했다.. 그나마 만들었다는 글은 3D 프린터로 프레임을 출력해서 저렴하게 만들었다는 글은 본적이 있는데.. 그래도 MX 28 모터를 사용했기 때문에.. 기본 500만원 이상은 나간다..
뭐 다른거라면 Poppy 로봇 커뮤니티에서 본걸로는 다른 회사의 서보모터에 무언가 장치를 부착해서 대체로 사용할 수 있도록 하는 글도 있던데.. 그 모터도 애초에 비싸다..!!
Windows의 경우 지원안하는 것이 좀 있기에 따로 설치해줘야 하는것이 있다. 그리고 silentcipher 이 라이브러리를 따로 설치하는데.. 이 라이브러리에 가보면 torch를 2.4.0으로 설치하게 되고.. 이 CSM Github에서도 2.4.0을 설치한다. 그래서 깔꺼 전부 깔고 난 후에 torch를 새로 설치하는 것이다. 아마도 2.x.x 버전이면 다 될 것 같다.
암튼 이렇게 하면 바로 설치가 끝난다..!
WSL에서 설치 방법
일단 WSL에서 설치하기 전에 Anaconda와 Cuda, Cudnn을 설치한다. 아래 링크에 가서 따라서 설치하면 된다.
이런 창이 보일 것이다. 이거는 딱히 필요없고.. Fine grained 바로 오른쪽에 Read 라는 버튼이 있다. 그걸 눌르면 된다.
그러면 이렇게 Token name 인 토큰 이름 적는게 나오는데 그냥 아무 이름 적으면 된다. 나는 간단히 하기 위해 그냥 "asd"로 입력했다. 그 후 아래에 Create token을 누른다.
그 후에는 토큰이 바로 나오는데, 알 수 없는 영어들이다. 그냥 그 오른쪽에 있는 Copy 버튼을 눌르면 토큰이 복사된다. 그렇게 가지고 있으면 된다. 만약에 까먹었으면 저 위에 링크 다시 가서 만들었던 토큰을 복사하면 된다.
이제 다 됬으니 바로 코드를 실행해보는걸로..!
코드 실행
코드 같은 경우 github에 적혀있지만.. 간단하게만 적어둬서 실행할려면 좀 python을 알아야 한다.
근데 뭐 그냥 아래 코드 복사하면 된다.
from huggingface_hub import hf_hub_download
from generator import load_csm_1b
import torchaudio
import os
import time
os.environ["HUGGING_FACE_HUB_TOKEN"] = "위에서 얻은 Token 그대로 이 문장 지우고 붙여넣기"print("Model Loading...")
start_time = time.time()
model_path = hf_hub_download(repo_id="sesame/csm-1b", filename="ckpt.pt")
generator = load_csm_1b(model_path, "cuda")
print(f"Model Loading Complete: {time.time() - start_time:.2f}s")
print("Audio Generation Start...")
start_time = time.time()
audio = generator.generate(
text="Hello from Sesame.",
speaker=0,
context=[],
max_audio_length_ms=30_000,
)
print(f"Audio Generation Complete: {time.time() - start_time:.2f}s")
print("Audio Saving...")
start_time = time.time()
torchaudio.save("audio.wav", audio.unsqueeze(0).cpu(), generator.sample_rate)
print(f"Audio Saving Complete: {time.time() - start_time:.2f}s")
좀 더 쉽게 알 수 있게 시간도 측정할 수 있도록 추가했다.
그리고 출력하는건 한국어도 할 수 있지만.. 폼이 안나기에 영어로..
일단 우선 알아야 할 것이 있다.
이 코드는 반드시 아까 다운로드한 csm 레포 안에다가 파일을 생성하고 거기에 붙여서 실행해야한다.
이유는 이용해야하는 파일이 그 폴더에 있기 때문..
그리고 코드에 보면
audio = generator.generate(
text="Hello from Sesame.",
speaker=0,
context=[],
max_audio_length_ms=30_000,
)
이 부분이 제일 중요하다.
text는 말 그대로 그냥 음성으로 바꿀 텍스트이고
speaker은 아마 말할 화자가 누구인가 일 텐데.. 이건 이후 다른 코드에서 쓰인다. 일단 위 코드는 간단하게 1명만 말하는 코드이기에 0으로 설정하면 된다.
context도 이후 다른 코드에서 쓰인다. 이것도 누구 화자인지에 대한 것을 설정할 때 쓰인다.
max_audio_length_ms 이게 가장 중요하다. 몇초를 만들게 할지이다. 내가 설정해놓은건 30초인데 그냥 앞에 2자리 숫자만 바꿔서 숫자를 늘리거나 줄이면 된다.
나는 문장도 길게 입력할 것이기에 적당히 늘려놓았다. (어차피 AI가 알아서 다 말하면 끊어버리기 때문에 그냥 길게 놓아도 상관은 없다.)
그리고 아까 복사했던 HuggingFace Token은 입력하라는 곳에 그대로 입력하면 된다.
그 후에 바로 실행해보면 된다..!
참고로 GPU는 6GB 이상은 필요하다. 그냥 적당히 8GB 이상은 되게 해야한다.
만약 그래픽카드가 부족하거나 없다면.. 그냥 CPU도 가능은 할 것이다. torch를 cpu 버전으로 깔았다면
암튼 실행!
/home/cheongpark/anaconda3/envs/csm/lib/python3.10/site-packages/pydub/utils.py:170: RuntimeWarning: Couldn't find ffmpeg or avconv - defaulting to ffmpeg, but may not work
warn("Couldn't find ffmpeg or avconv - defaulting to ffmpeg, but may not work", RuntimeWarning)
Model Loading...
ckpt path or config path does not exist! Downloading the model from the Hugging Face Hub...
Fetching 13 files: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 13/13 [00:00<00:00, 198276.19it/s]
Model Loading Complete: 12.54s
Audio Generation Start...
Audio Generation Complete: 4.94s
Audio Saving...
Audio Saving Complete: 0.01s
실행해보면 이렇게 영어가 이상하게 나오면서 정상적으로 실행이 된다..! 물론 이 전에 모델을 한번 다운 받고 실행하게 된다. 모델은 대충 6GB이다.. 만약 모델 다운 받을 때 다운 안되면 Token 제대로 발급 안했거나 Read로 발급 안했을 때 발생한다. 아니면 라이브러리 잘 못 깔았던지..
그리고 소리를 들어보면..
이렇게 잘 된다..!
그리고 목소리의 경우 실행할 때 마다 바뀐다.. 저건 뭔가 빵 먹으면서 말하는 것 같은데..
똑같은걸 다시 실행하면 이렇게 된다.
테스트 및 Windows와 WSL 속도 비교
한번 Windows와 WSL의 속도 차이를 비교해볼 것이다.
우선 내 컴퓨터 사양을 말하자면..
CPU : AMD 5900X
RAM : Samsung DDR4 32GB 3200
GPU : MSI RTX 3080 TI
이다.
어차피 코드하고 GPU 이런거는 다 같기 때문에 소리는 거의 차이 없을 것이고.. 그냥 단순히 실행 속도를 비교한다면..
Windows
Model Loading... Model Loading Complete: 16.23s Audio Generation Start... Audio Generation Complete: 7.19s Audio Saving... Audio Saving Complete: 0.00s
WSL
Model Loading... Model Loading Complete: 13.42s Audio Generation Start... Audio Generation Complete: 4.84s Audio Saving... Audio Saving Complete: 0.01s
대충 이렇다. Windows가 살짝 더 느리다..
그리고 이번에는.. 아까 설정했던 text에 따로 ChatGPT 한테 말해서 생성한 문장을 넣고 max_audio_length_ms를 60_000으로 설정해서 실행해볼 것이다.
문장의 경우 아래 문장을 사용했다.
Hi, I’m Robi!
Nice to meet you!
I’m Robi, a friendly robot designed to make life more fun and interactive.
I can walk, talk, dance,
and even understand your feelings!
I respond to your voice and can have simple conversations with you.
I’m made up of over 70 parts,
and I was built step-by-step using a special magazine series.
My design allows me to express emotions
through my eyes and gestures,
making me feel more lifelike.
I’m powered by a sophisticated control board and motors
that help me move smoothly.
My speech recognition lets me understand commands,
and I can even learn new things over time.
I’m always ready to chat, play,
and keep you company.
Let’s have fun together!
참고로 문장 넣을 때는 "문장" 이렇게 쌍따옴표 한개로 하면 한줄로만 작성할 수가 있고..
'''문장''' 이렇게 따옴표를 3개씩 해두면 여러 줄에 걸쳐서 입력할 수 있다. 여러줄에 걸쳐서 입력하는게 좋긴 하다.
암튼 실행해보면!
Windows (파일 크기 : 4.15MB)
WSL (파일 크기 : 3.7MB)
이렇게 출력된다.
나는 추가로 여기에는 Seed를 설정을 따로 할 순 없지만.. 토치나 이런거는 가능하기에 그건 Seed를 설정했다. 그래서 음성은 그나마 비슷하나.. 다른 곳에선 Seed 영향을 안받는 것이 있을 것이기 때문에.. 위 오디오 처럼 약간만 비슷하다.
그 시드 설정을 안하면 아예 똑같은 느낌도 아니긴 하다..
암튼.. 생성이 잘 못 되었는지.. 음성이 조금 깨져서.. 별로긴 하다..
이것도 속도 비교를 해보면..
Windows
Model Loading... Model Loading Complete: 22.65s Audio Generation Start... Audio Generation Complete: 149.14s Audio Saving... Audio Saving Complete: 0.04s
WSL
Model Loading... Model Loading Complete: 15.53s Audio Generation Start... Audio Generation Complete: 115.58s Audio Saving... Audio Saving Complete: 0.01s
이렇게 확실하게 차이가 나는 것 같지만.. 파일 크기를 보면 다르기에.. WSL이나 Windows나 WSL이 좀 더 속도가 빠르긴 하지만 거의 비슷하다는 것을 알 수 있다. 30초 정도의 차이는 파일 크기에 비례하는걸로.. 생각하는걸로..
이것 외에 추가로 테스트 해보면 똑같은 문장을 생성을 잘 해본게 있는데..
이건 깔끔하게 잘 되었다..!
그리고 2번째 테스트!
2번째 코드
이 코드는 첨부만 하고 딱히 실행은 안해볼 것이다. 실행을 해보긴 했지만.. 좋긴 하나 실행하는 것에 어렵기도 하고.. 글 쓸 시간도 부족해서..
from huggingface_hub import hf_hub_download
from generator import load_csm_1b
from dataclasses import dataclass
import torch
import torchaudio
import os
@dataclassclassSegment:
text: str
speaker: int
audio: torch.Tensor
os.environ["HUGGING_FACE_HUB_TOKEN"] = "위에서 얻은 Token 그대로 이 문장 지우고 붙여넣기"
model_path = hf_hub_download(repo_id="sesame/csm-1b", filename="ckpt.pt")
generator = load_csm_1b(model_path, "cuda")
speakers = [0, 1, 0, 0]
transcripts = [
"Hey how are you doing.",
"Pretty good, pretty good.",
"I'm great.",
"So happy to be speaking to you.",
]
audio_paths = [
"utterance_0.wav",
"utterance_1.wav",
"utterance_2.wav",
"utterance_3.wav",
]
defload_audio(audio_path):
audio_tensor, sample_rate = torchaudio.load(audio_path)
audio_tensor = torchaudio.functional.resample(
audio_tensor.squeeze(0), orig_freq=sample_rate, new_freq=generator.sample_rate
)
return audio_tensor
segments = [
Segment(text=transcript, speaker=speaker, audio=load_audio(audio_path))
for transcript, speaker, audio_path inzip(transcripts, speakers, audio_paths)
]
audio = generator.generate(
text="Me too, this is some cool stuff huh?",
speaker=1,
context=segments,
max_audio_length_ms=30_000,
)
torchaudio.save("audio.wav", audio.unsqueeze(0).cpu(), generator.sample_rate)
이번엔 이런 코드이다. 이 코드를 간략하게 설명하자면.. 이전 대화들의 억양, 목소리, 흐름, 등등을 파악해서 그 목소리를 구현하는 것이다.
코드를 보면 알 수 있는데..
speakers = [0, 1, 0, 0]
transcripts = [
"Hey how are you doing.",
"Pretty good, pretty good.",
"I'm great.",
"So happy to be speaking to you.",
]
audio_paths = [
"utterance_0.wav",
"utterance_1.wav",
"utterance_2.wav",
"utterance_3.wav",
]
여기에서 speakers에 있는 것이 위에 잠시 말했던.. speaker인 누가 말하는 화자인지.. 여기에서는 1번이 AI 화자 인 것이다.
그리고 transcripts는 대화 들인데..
간단하게 정리를 해보면
대화 : "Hey how are you doing.", 파일 이름 : "utterance_0.wav", 화자 ID : 0
대화 : "Pretty good, pretty good.", 파일 이름 : "utterance_1.wav", 화자 ID : 1
대화 : "I'm great.", 파일 이름 : "utterance_2.wav", 화자 ID : 0
대화 : "So happy to be speaking to you.", 파일 이름 : "utterance_3.wav", 화자 ID : 0
이렇게 정리할 수 있고.. 이게 편하게 알 수 있을 것이다.
이걸 나중에 생성할 때 아까 위에서 설정한 speaker를 1로 설정하고 실행하게 되는데.. 그렇게 하면 이전 대화에 화자 ID의 1번 목소리를 복사해서 흐름에 맞춰 자연스럽게 말하게 된다.
audio = generator.generate(
text="Me too, this is some cool stuff huh?",
speaker=1,
context=segments,
max_audio_length_ms=30_000,
)
여기에서 보이는 것 처럼 위에 대화에 따라서 다음 말할 것을 지정해주고.. 몇번 ID의 화자를 복사할 것인지 설정을 해주고 이전 대화 목록들을 저장한 segments를 지정하고 초를 지정해주면 되는데.. 아마 실행이 안될 것이다.
이유는 audio_paths에 진짜 음성 파일이 없기 때문이다..
그래서 음성을 만들거나.. 아니면 직접 목소리를 녹음해서 해보면 된다..
(글 쓸 시간이 부족해서.. 따로 해본것은 적지 않겠다. 직접 해보시길..!)
암튼 그렇다.
결론
위에서 예시를 봤듯이..
이건 데모 처럼 실시간 음성 대화 모델은 아닌 것 같다..
아직 모델이 1B 밖에 풀리지 않았고 추가적인 코드가 풀리지 않았기에.. 바로 말하기는 어렵지만..
현재 공개된 코드에서는.. 음성 대화 모델은 아닌 느낌이다..
솔직히 그냥 TTS 모델 같다.
그냥 대화를 지정하고 그것에 맞춰서 말하게 하는 Zero Shot TTS 모델으로 생각된다.
이런 TTS 모델은 이미 다른 곳에서도 개발되고 연구되었기에.. 실시간 음성 대화 모델이 공개로 풀리지 않는 이상..
이 모델을 사용해야하는 이유는 딱히 없다고 생각된다..
그리고 일반 GPU에서 이정도 속도이면.. 너무 느리기도 하고..
암튼.. 이번 모델은 약간 아쉽다..
암튼 그렇다.
그리고 모델 크기는 크기 때문에 한번 사용하고 나면 지우는걸 추천한다. (컴퓨터 용량 크면 딱히 상관은 없지만..)