본문 바로가기
프로젝트

시계열 분석 팀 프로젝트 (2)

by Oddmin 2025. 4. 18.

 

프로젝트 두 번째 날,

오늘 진행했던 내용은 크게 다음과 같다.

 

1. 주제 투표해서 정하기

2. 회의록 작성 및 강사님께 컨펌받기

3. Gantt chart 다듬기


주제 정하기

어제에 이어서 주제에 대해서 좀 더 탐색하는 시간을 가졌다.

 

후보 주제에 대해 의견을 내놓았던 팀원들도 추가 의견을 냈고,
좀 더 시간이 필요했던 팀원들도 하나하나 의견을 내기 시작했다.

 

최종적으로 나왔던 후보 주제는 10개를 넘어갔다.

 

이들 후보 주제에 대해 투표를 진행하기에 앞서,
후보 주제 많았기에 나는 어떤 기준으로 주제를 선정해야 할 지 생각해보았다.

앞서 진행했던 첫 번째 프로젝트에서는 해당 주제가 아래를 만족하는지 판단하여
투표를 하는 식으로 진행하였다.

  1. 주제 적합성
  2. 추진 구체성
  3. 실현 가능성
  4. 독창성

이번 프로젝트에서는 이전 주제 평가방식을 차용하면서
단순히 하나의 주제를 선택하는 것이 아닌, 해당 주제가 얼마나 적합한지 정도까지 고려할 수 있도록
아래 사진과 같이 선택지를 구성하였다.

 

이때, 1점은 "잘 모르겠다", 3점은 "그렇다"로 설정하였다.

 

투표를 막 진행하려던 찰나, 일부 팀원으로부터 투표해야 할 주제 수가 너무 많다는 의견이 나왔다.


개인적인 주관으론 다들 조사해서 찾아온 주제들인데
투표도 하기 전에 탈락시키는 것은 좀 아니다 싶어 다른 팀원들의 의견도 들어보았다.

 

다행스럽게도(?) 각자 가져온 주제들과 관련된 데이터를 찾아보며 데이터 수집 과정 등에서 어려울 것 같다 말하는
팀원들이 있었고, 이후 논의하여 실현 가능성이 너무 떨어지는 주제를 일부 탈락시는 것으로 합의되었다.


최종적으로 7개 후보 주제에 대해 투표를 진행하는 것으로 좁혀졌다.

아래는 투표 결과이다.

 

 

한번에 딱딱 계산해서 나오면 좋겠지만...

(내가 기능을 잘 활용하지 못해서 노가다 식으로 점수를 산정한 것 같긴 하다..ㅎㅎ)

(이미 만들어 놓은 걸 바꾸긴 너무 늦었기 때문에 그냥 진행시켜...!! 마인드..)

 

주제별 점수순위는 아래와 같다.

 

이제 다음 단계는, 해당 주제로 프로젝트를 진행해도 될 지 강사님께 컨펌받는 단계를 앞두고 있었다.

 

이전 프로젝트에서는 하나만 검토요청을 했다가
해당 주제로 모델 구축을 했을 때 기대효과가 너무 직관적이지 않다는 사유로 반려를 당했었다.

 

그래서 이번엔 위 사진과 같이 1위, 2위, 3위로 순위를 매겨 3개 안을 검토받는 전략을 사용했다.

 

강사님께 컨펌받기 전 회의록 작성이 필요했기 때문에

바로 다음 단계는 3위까지의 주제에 대해 회의록을 작성하는 것이었다.


회의록 작성 및 컨펌받기

회의록에는 아래와 같은 내용이 포함된다.

  • 프로젝트 목표
    - 어떤 것을 예측할 것이며 간략한 기대 효과
  • 수집 데이터
    - 어떤 데이터를 수집할 것인지
  • 데이터셋 구축
    - 데이터를 어떻게 전처리 할 것인지
    - 어떤 데이터를 입력, 출력 변수로 설정할 것인지 등
  • 모델링 전략
    -LSTM, Random Froest 등 어떤 모델을 사용할 것인지
  • 기대 효과
    -모델 구축 시 기대할 수 있는 효과


이처럼 회의록을 작성하기 위해선
어떤 것을 예측할 것인지, 어떤 데이터를 사용할 것인지, 데이터가 어떤 특성인지
구체적이진 않더라도 은 잡고 가는 게 중요하다.

 

이를 위해서 추가적으로 자료조사를 진행했다.

우리 조는 6명으로 구성되었기 때문에 2명씩 3조로 나눠서 선별된 각 주제에 대해 조사했다.


해수면 높이를 예시로 . . .

해수면 높이를 예측하기 위해선
어떤 요인들이 해수면 높이에 영향을 미치는 지 조사해야 한다. 

 

나는 주로 Perplexity라는 AI 기반 대화형 검색 엔진을 이용했다.


How?

"해수면 높이에 영향을 끼치는 요인을 알려줘" 라고 질문을 하였고,
검색해서 나오는 요인들에 대해 추가 조사를 하고,
답변을 생성하게 된 근거가 되는 출처 사이트를 들어가서 실제 그 내용이 맞는지 검증하였다.

 

실제 작성된 기획안 일부는 아래 사진과 같다.

 

보다시피 틀만 잡는 것으로, 매우 구체적이진 않다.


 

현재 기획안 작성은 해당 주제로 진행해도 될 것인지를 판단하는 과정으로
추후 더 구체적으로 작성할 것이기 때문에 이 정도까지만 작성하고 강사님께 컨펌을 요청하였다.

최종 선택된 주제

총 3개 주제에 대해서 컨펌을 받았으며
이번에는 처음 프로젝트와는 다르게, 모두 진행해도 된다는 확인을 받았다.

 

다만 아쉽게도 해수면 예측은 비슷한 주제로 다른 조가 진행하고 있었기에
온실가스 수치 예측항공기 엔진 잔여 수명 예측 둘을 놓고,
결국에는 데이터 수집이 더 용이한 항공기 엔진 잔여 수명 예측최종 주제로 선택하게 되었다.

(엔진 잔여 수명 예측은 NASA에서 제공하는 데이터셋을 사용하였다)
(후보 주제 탐색 단계에서, 이미 팀원이 데이터셋을 확보한 상태였기 때문에 빠르게 진행할 수 있었다)


Gantt chart 다듬기

정해진 내용과 앞으로 수행할 내용을 바탕으로 간트 차트를 다듬었다.

아마 기간이 일부 수정될 것으로 예상된다.

 

이제 나는 프로젝트의 방향성이 정해졌으니
PPT를 조금씩 작성해나갈 예정이다.

 

데이터 전처리, 모델 구축은 맡은 팀원들이 잘 해낼 것이라 믿으며

돌아오는 다음주 월요일부터는 데이터 리뷰를 통해
추가로 자료조사할 부분을 전달하고, 시각화된 데이터를 정리해서 PPT로 구성할 계획이다.