ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • 자율주행을 위한 데이터 파이프라인 구축 방법 알아봐요
    카테고리 없음 2020. 2. 20. 00:00

    >


    이번에는 테스트 및 조사차량에서 데이터를 수집하기 위한 어프로치와 프로세스 모두에 걸쳐 데이터 요구를 충족시키기 위한 적절한 데이터 파이프라인의 구축방법을 탐구합니다.​, 자율 주행 도전 ​은 대부분의 회사는 이미 Level 4자율 주행과 그 이상을 위한 토대로서 점점 정교한 운전자 지원 시스템(Advanced Driver Assistance System, ADAS)를 제공한다 슴니다.


    >


    자율주행차(AV) 개발 프로젝트는 상당한 데이터 과제에 직면해 있습니다. R&D를 위해 배치된 각 차량은 산과 같은 데이터를 생성한다.현장에서 차로 데이터를 효율적으로 이동하여 심층 신경망(Deep Neural Networks, DNN)을 훈련할 수 있는 파이프라인을 어떻게 구축합니까? · DNN 학습을 위해 이미지 및 기타 센서 데이터 및 레이블(주석) 데이터를 어떻게 효율적으로 준비합니까?신경망을 훈련하는데 어느 정도 나쁘지는 않으니 많은 예지와 컴퓨팅이 필요한가요? 학습 클러스터가 사내 또는 클라우드에 있어야 하는가?·예상 요구사항, 네트워크 대역폭 및 컴퓨팅 용량을 비롯한 데이터 파이프라인 및 학습클러스터에 맞는 인프라를 어떻게 올바르게 하고 있습니까? 고려해야 할 다른 데이터의 흐름은? 자율주행차 개발을 위한 데이터 파이프라인 자율주행차 개발 프로그램은 각각 고유한 데이터 관리 요건을 가진 많은 구성 요소를 가지고 있습니다. 데이터의 양과 다양성은 모든 영역에서 고유한 문제를 만듭니다. 이 절에서는, 그 후와 같은 여러가지 핵심 영역에서 특정 데이터나 컴퓨팅의 문제를 설명할 것이다.완전 센서 슈트(full sensor suites)가 장착된 테스트 차량의 데이터 수집 테스트 차량에서 파생된 라벨(Label) 데이터를 사용하여 DNN 학습 DNN의 성능을 테스트하고 추가 학습 데이터를 생성하기 위한 시뮬레이션 매핑으로 물리적 환경에 관한 자세한 모습 생성 이후의 그림은 파이프라인 구성 요소를 상위 레벨로 요약한 것입니다.​


    >


    테스트 차량에서의 데이터 수집 데이터 수집 프로세스 동안 데이터는 fleet의 각 테스트 차량에서 수집되어야 합니다. 자동차 1대당 실제에 수집하는 데이터의 양은 센서 정장에 의해서 다를 것이다.​ 가이드 라인은 초기 학습 때 때 테러단 1~5TB의 테테로울 방안과 실제의 결과를 수신할 때 방안을 업데이트하세요.시험 차량의 데이터 수집은 2단계에서 본인화합니다.초기 학습(Initial training). 만약 당신이 아내 음에서 DNN을 훈련시키고 있다면 당신은 당신의 시험 차량에서 모든 운전 데이터를 수집해야 할 것입니다.​, 전달 학습(Transfer training), 1단 여러분의 DNN이 잘 작동하기 시작하면, 여러분은 시험 차량이 잘 작동 안 하고 본인 안전 운전자들이 통제하는 정세만 데이터를 수집할 필요가 있고 본인을 수집하는 것을 원할 수 있슴니다.특히 초기 학습 중에는 대역 폭의 제한과 비용 때문에 각 차량에서 데이터를 휴대 전화 네트워크를 통해서 전송되는 것은 없을 것 같습니다. 각 차량에 데이터를 저장하고 차가 차고 본인의 창고에 도달할 때 주기적으로 다운로드하는 현실성이 더 높습니다.그러기 위해서는, 각 테스트 차량과 차고 위치 전체에서 데이터 스토리지 인프라가 필요합니다. dest Fleet이 다른 도시로 확장됨으로써 다른 각 도시의 데이터를 집계하기 위해 허브 위치를 추가할 필요도 있습니다.​ 데이터 집계 시험 차량에서 데이터를 수집하는 경우 데이터 센터, 본인 클라우드(역시는 둘 다)에서 데이터 레이크(Data Lake)로 집계할 1반 적이다. 데이터 레이크는 1반 적으로 HDFS, 객체의 저장고는 파 1시설을 사용하고 Hadoop을 구축하는 형식을 취합니다.데이터 레이크가 부적절하게 실장되면 데이터가 축적됨으로써 병목현상이 생성될 수 있으므로 이러한 세심한 고려가 중요합니다. 수집되는 데이터의 양 때문에 자율 주행 자동차의 개발 프로그램의 현재의 모범 예는 데이터 레이크와 훈련 클러스터를 사내에 두는 것이다, 어쩌면 이 프로젝트의 1부 부분도 클라우드에 있는 슴니다. ​ ​ 가이드 라인은 연간 테스토챠랴은당, 적어도 2PB의 데이터에 대한 방안 수립 ​ 밖에 이야기하면, 테스트, 자율 주행 자동차 10대가 매년 최소 20PB의 데이터 레이크 용량을 대책합니다. 때때로, 이 지남에 따라 수집한 데이터의 상당 부분이 빈번히 액세스 되지 않는 일이 있기 때문에, 어떠한 형태의 콜드 스토리지도 바람직해 집니다.​ ​ 데이터 라벨 지정 AV개발에서 가장 커다란 보틀 넥 중 하봉잉눙의 라벨이 붙여진 학습 데이터의 필요성 1수 있슴니다. 특히초기학습중에는알고리즘이자율주행중에본인이될수있는다양한물체(다른차량,도로표시,표지,곡선,보행자,자전거사람등)를정확하게식별할수있도록 수백만개의라벨기지가필요할수도있습니다.​도 하군 이 연간 시험 차당 2PB의 데이터를 예상하면 그것은 약 10억개의 기이지로 해석되며, 그 중 300만개 이상의 기이지에 꼬리표를 붙여야 하는 경우도 있슴니다. 이 분류는 여전히 사람에 의해 거의 이루어지고 있습니다.많은 기업이 외주인력을 사용하여 라벨을 표시합니다. 이는 때때로 세계의 다른 지상에서 그러한 근로자가 필요한 데이터에 접근할 수 있도록 하는 것을 의미합니다. 라벨이 지정된 기이지에 대한 전송 비용에도 불구하고 이를 달성하기 때문에 데이터를 클라우드로 이동해야 할 수 있슴니다. ​ ​ DNN, 학습자율 주행을 위한 DNN을 설계하는 단지 1접근 방식은 없지만 각종 개별적인 작업을 수행하는 별도의 DNN이 있는 앙상블 접근을 사용할 1반 적이다. 예를 들어 경로 방안, 객체 식별, 읽기 기호, 정지 등 상태 감지 및 기타 기능을 위한 DNN이 있을 수 있습니다.사실 이것은 여러분들이 단 한 명의 DNN을 훈련시키는 것이 아니라, 여러분은 각 문제 등급에 대해 다른 접근을 포함하여 여러 개의 DNN을 훈련시키고 정기적으로 그렇게 하는 현실성이 있다는 것을 의미합니다. 이는 필요한 계산 규모를 크게 증가시키기 때문에 인지하는 것이 중요합니다.​ 디플러 닌 학습 클러스터에서 현재 기술의 정 세운 스케 1아웃 클러스터에 잠재적으로 소보 댄 수백대와 4~8대의 GPU가 있슴니다. I/O의 관점에서 그데웅 모든 GPU을 100% 바쁘게 유지하지 않으면 안 됩니다. 그 데이터를 기다리는 GPU을 유휴 상태로 함을 피할 필요가 있습니다. ​ NVIDIA DGX-1디플러 닌 시스템은 8개의 NVIDIA GPU지원 CPU와 고성능 인터 커넥트를 포함하고 있슴니다. AV애플리케이션의 경우 단 1 DGX-1은 하루에 하봉잉의 DNN에 300K라벨의 깃발을 훈련시킬 수 있슴니다. 테스토챠랴은당 300만개의 라벨이 붙은 영상과 다양한 연구가 병렬로 실행되는 10개의 DNN이 있다고 소가족, 테스토챠랴은당 최대 100개의 DGX-1이 필요할 수 있슴니다. ​ 가이드 라인:DNN을 배우기 위한 테스토챠랴은당 100대의 DGX-1시스템(역시는 그에 상응하는 시스템)에 대한 대책을 마련하세요.시뮬레이션/재시뮬레이션의 대부분의 AV 개발 프로그램에서 시뮬레이션은 프로세스의 중요한 구성 요소이다. 시뮬레이션을 통해 DNN은 다양한 주행환경을 시뮬레이션하고 테스트 차량에서 수집된 실제 시나리오를 재생하여 신속하게 테스트할 수 있습니다(이런 시나리오 변형뿐만 아니라).시뮬레이션은 그 자체로 상당한 연구와 혁신의 영역이다. 많은 기업이 특히 자율주행차와 로봇을 위한 현실적인 시뮬레이션에 초점을 맞추고 있습니다. 시뮬레이션의 성공에는 다양한 측면이 있습니다.필요한 해상도의 달성 및 모든 차량 센서에 대한 실제 입력 공급·연구 중인 DNN의 앙상블에 필요한 추론 성능 공급, 다양한 시뮬레이션 스트림이 병렬로 실행되는 현실성·차량, 자전거, 보행자 및 기타 모든 비 정차 요소의 정확한 모델링. ​ 3D, 매핑, 많은 AV프로그램의 역시 다른 중요한 요소는 고화질 3D매핑이다. 많은 AV 어프로치는 주행 경로의 고화질 지도를 이용합니다. 차량의 센서 어레이에서 기존 지도까지의출력을 비교하는 것은 경로방안 프로세스를 단순화하는 노하우로 많은 사람들이 고려됩니다.만약 이것이 당신이 사용하려는 접근방식이라면, 당신은 처음에 당신이 당신만의 매핑을 하는지, 아니면 타인의 데이터에 의존하는지를 판정해야 합니다. 많은 신생 기업들과 다른 기업들이 데이터 세트 매핑 작업을 하고 있습니다.​ 본인만의 매핑은 경쟁적인 이점을 공급할 수 있으며, 그것은 너 이 방안의 센서 어레이와 더 밀접하게 1치 하고 있지만 상당한 추가 투자를 본인의 잡으려는 HD지도를 만들 수 있게 하는 슴니다. 대상 지상에 맞는 고해상도 3D지도를 직접 만들 방안이라면 필요한 모든 곳에 매핑 데이터를 수집, 처리 및 공급하기 위해서 필요한 데이터와 파이프 라인을 수집하기 위해서 적절한 센서를 갖춘 조사의 차가 필요할 것이다. 매핑 프로세스는 프로그램이 확장될 때 새롭게 영역으로 확장되어야 하고 지도는 정기적으로 다시 써야 합니다.끼어드는 자율주행차를 개발하는 입장에서 보면 가장 중요한 소견이 아마 오늘 이야기인 Data를 어떻게 잘 관리할 것인가 싶습니다. 자율주행차량에 관한 뉴스를 접하면 자율주행에서 주행거리, 주행에서 얻을 수 있는 정보의 라벨 정의, AI를 위한 학습 등의 스토리를 듣습니다. 그런 정보들을 단발적으로 접하게 되면 뭐가 sound인지 잘 이해하지 못하는 분들도 있을 수 있습니다. 이번 공지는 그런 정보를 쉽게 연결해주지 않을까 싶습니다.결미 자율주행차는 기술적인 이야기에서의 최종 목적은 사람을 대신하는 인공지능을 가진 로봇을 구현하는 것이다. 이런 AI를 위해서는 사람이 성장하면서 학습하듯이 AI에게도 학습과정을 거쳐 사람의 수준이 되게 할 것이다. 사람도 많은 경험을 하고 그러한 경험의 적절한 조합으로 새롭게 정세에 합리적인 판단을 할 수 있습니다. 자율주행차의 AI도 합리적인 운전을 하기 위해서는 남이 하는 것과 같은 많은 경험을 하고, 그런 경험을 바탕으로 이후에 운전을 할 때는 보다 본인은 반응을 보여야 합니다. 사람은 자신이 경험하고 판단하는 단지 1존재로 모든 것을 해결할 수 있지만 AI의 경우는 그러한 경험을 학습하기 위한 별도의 입력 장치의 Data이 필요합니다. 그래서 자율주행차를 개발하는 기업들은 테스트 차량을 통해 많은 데이터 수집에 집중하고 있습니다.하지만 그렇게 수집된 데이터는 어떻게 활용할지는 자율주행차를 개발하는 기업에 따라 다르지만, 개별적으로 생성되는 테스트 차량의 데이터를 수집하고 정리하고 필요한 작업을 하기 위해서는 자율주행차를 개발하는 모든 사람과 같은 정보를 공유해야 합니다. 그러기 위해서는 데이터를 한 사람에게 모을 수 있는 저장소가 필요하고 어디서든 접근할 수 있는 클라우드가 공급되어야 합니다. 이번 글을 작성한 기업이 그런 제품을 공급하는 기업이다.저도 가끔 자율주행차를 개발하는 기업이 AWS, Microsoft 같은 클라우드 서비스를 공급하는 업체와 협력한다는 소식을 전해왔습니다. Microsoft의 경우 신생 스타트업을 위해 무상으로 지원하는 프로그램도 있습니다. 즉, 이런 자율주행차의 데이터를 관리하는 것은 많은 비용이 필요한 작업이다. 작은 기업에서는 접근이 쉽지 않다는 것을 단적으로 나타내기도 합니다. 이러한이유,최근들어많은기업들은본인들이데이터를연구목적의기관에dataset을공급하고있습니다. 그리고 WEF의 경우에는 dataset 공유를 위한 프로젝트를 시작하였습니다.자율주행차의 발전방향이 어떻게 진행될지는 정확히 예상하기 어렵습니다. 현재는 기술적 발전보다는 사회적 수용에 대해 더 많은 이야기를 하고 있으니까요. 이러한 사회적 수용에 관한 이야기를 더욱 진전시킴으로써 이러한 데이터 공유에 관한 스토리도 진행되지 않을까 생각합니다. 수많은 자율주행차 '그냥'에 대해 여러 단체에서 진행 중입니다. 이런 움직임에 보다 안전한 자율주행차 개발을 위한 데이터 공유를 요구하는 의견이 모여 지금보다 더 활발한 공유의 길이 열리지 않을까 한 번 소견합니다.본공지는NetApp이라는기업에서자율주행차의Data관리와본인제품을소개하는글이었습니다. 문장 중간에 포함된 Net App제품에 대한 소개는 제외하고 자율주행차의 Data관리 프로세스를 간단하게 소개했습니다. 만약 Net App관련 제품 정보가 필요하신 분 계시면 아래 참고자료의 원문 사이트를 참조하시기 바랍니다.P.S 검색으로 보시다가 원하시는 이야기를 찾지 못할 경우, 태그 역시 검색을 해보시면 더 많은 자료를 찾을 수 있습니다. 그래도 찾으시는 이에키이 않으시다면 저에게 연락 주시면(대째 1, 메모)내가 아는 범위 내에서 도움이 되도록 하겟슴니다. 부그다소리 안 가져도 돼요.Over the Vehicle!!!참고 자료



    댓글

Designed by Tistory.