NGMsoftware

NGMsoftware
로그인 회원가입
  • 매뉴얼
  • 팁 앤 테크
  • 매뉴얼

    팁과 테크니컬 노하우를 확인하세요.

    팁 앤 테크

    팁과 테크니컬 노하우를 확인하세요.

    본 사이트의 컨텐츠는 저작권법의 보호를 받으므로 무단 복사, 게재, 배포 등을 금합니다.

    스크립트 웹사이트에서 텍스트를 추출해서 엑셀로 저장하는 방법. (How to extract text from a website and …

    페이지 정보

    본문

    안녕하세요. 엔지엠소프트웨어입니다. 웹 업무를 자동화려면 웹 API를 이용해서 텍스트를 추출하고, 액셀에 저장하는건 기본중에 기본 기능입니다. 하지만~ 개발자가 아니라면 이 기능을 구현하는것조차 상당히 어려운 문제일 수 있습니다. 웹 관련 개발자라면 기본적인 개념은 잡고 있어서 쉽게 처리할 수 있을겁니다. 이 기능을 학습하기전에 아래 내용을 먼저 읽어보시면 도움이 될겁니다.

    [ 엑셀 자동화 매크로 만들기 ]

     

    테스트를 위해 새로운 스크립트를 추가해줍니다.

    qDLvjT0.png

     

     

    아래 그림을 참고해서 웹 API의 [ 연결 ]과 [ 텍스트 ] 액션을 추가해줍니다.

    ZrhpRFV.png

     

     

    추출할 텍스트는 네이버의 "오늘 읽을만한 글"의 카테고리입니다.

    wbxSm8i.png

     

     

    우선, 네이버에 연결하기 위한 설정을 해야 합니다. 연결 액션의 아이디는 "네이버"로 설정하세요. 그리고, 아래 그림을 참고해서 설정을 마칩니다.

    r1LQKgo.png

     

     

    네이버에서 텍스트를 가져오기 위해 사이트 구조를 분석해야 합니다. 네이버에서 F12를 누르세요. 그리고, 아래 동영상과 같이 xpath 를 복사 해줍니다.

    kUqZswh.gif

     

     

    엘리먼트가 Input 콘트롤이라면 별도 옵션 없이 텍스트를 가져올 수 있습니다. 엘리먼트의 타입에 따라 추가적인 옵션을 설정해야 하는데요. 오늘 읽을만한 글의 카테고리는 a 태그입니다. 그렇기 때문에 "엘리먼트 정보 옵션"을 "Attribute"로 설정하고, "추출 옵션 이름"을 "text"로 입력해야 값을 가져올 수 있습니다.

    5akPWYB.png

     

     

    HTML의 엘리먼트들은 각각의 특성과 속성을 가집니다. input 태그들은 text를 사용해서 값을 가져올 수 있지만, 기타 다른 엘리먼트들은 특성(Attribute)이나 속성(Property)으로 값을 가져와야 합니다. a 태그는 text 특성을 이용해야 합니다. 참고로, CSS도 설정된 값들을 가져올 수 있습니다. 예를 들어 "background-color"를 입력하면 이 CSS에 설정된 속성의 값을 가져옵니다. 이렇게하면 엘리먼트의 배경색도 알 수 있습니다. 아무튼, 실행하면 "엘리먼트 정보"에 텍스트를 읽어오는걸 알 수 있습니다.

    AGJOS4J.png

     

     

    웹사이트에서 텍스트를 가져왔으므로, 이제 엑셀에 저장해야 합니다. 값을 저장할 변수를 하나 추가하고, "웹텍스트"로 아이디를 설정해줍니다. 그리고, "덮어 쓰기" 속성을 "True"로 변경하세요.

    FoveJIh.png

     

     

    아래 동영상을 참고해서 네이버에서 읽어온 텍스트를 변수에 저장합니다.

    aqLQECA.gif

     

     

    바탕화면에 "네이버.xlsx" 파일의 첫번째 셀에 읽어온 값을 저장해줍니다. 우선, 아래와 같이 설정해주세요.

    VOGUeFV.png

     

     

    그리고, 변수로부터 값을 가져옵니다.

    MWYq7n0.gif

     

     

    실행한 후 엑셀을 열어보세요. 첫번째 셀에 "엔터"라는 값이 입력되어 있는걸 확인할 수 있습니다.

    aJDyEBP.png

     

     

    이렇게해서 간단하게 웹사이트의 텍스트를 읽어서 엑셀에 저장해봤습니다. 업무를 자동화 한다는건 여러가지 경우의 수를 모두 생각해서 정리 후 작업해야 합니다. 일반적으로 매일 반복 업무를 하던 사람이 프로세스를 가장 잘 알고 있습니다. 그래서, 스크립트 제작을 의뢰하기 보다는 직접 스크립트를 만드는게 좋을 수 있습니다. 물론, 여러가지 테크닉이나 세부 기능들을 잘 알아야 하지만요~ 가급적이면 매뉴얼과 팁 & 테크를 가볍게 한번씩 읽어보시길 추천드립니다. 그래야~ 필요한 기능이 있을 때 기억을 더듬어서 찾아보고 만들 수 있으니까요. 궁금한 내용이 있으시면 질문과 답변 게시판에 남겨주세요. 추가적인 답변을 달아 드리도록 하겠습니다.

     

    개발자에게 후원하기

    MGtdv7r.png

     

    추천, 구독, 홍보 꼭~ 부탁드립니다.

    여러분의 후원이 빠른 귀농을 가능하게 해줍니다~ 답답한 도시를 벗어나 귀농하고 싶은 개발자~

    감사합니다~

    • 네이버 공유하기
    • 페이스북 공유하기
    • 트위터 공유하기
    • 카카오스토리 공유하기
    추천0 비추천0

    댓글목록

    등록된 댓글이 없습니다.