딥 러닝을 사용하여 자동화 된 제목 태그를 최적화하는 방법에 대한 Semalt 조언



SEO 순위에서 선두를 차지하는 빠른 방법은 제목 태그에 최상위 키워드를 포함하는 것입니다. 그리고 잠시 생각해 보면 이것이 정말 현명한 솔루션이라는 것을 알게 될 것입니다. 제목에 해당 키워드가없는 키워드 순위가 이미있는 페이지가있는 경우 제목에 키워드가있는 것의 중요성을 상상해보십시오. 당연히 해당 키워드에 대해 더 자주 인덱싱됩니다. 따라서 순위가 ​​더 높습니다.

이제 해당 키워드를 가져와 메타 설명에 추가하면 검색 결과에 강조 표시되어 더 많은 검색 엔진 사용자가 클릭 할 가능성이 높습니다. 물론 이것은 웹 사이트에 도움이 될 것입니다.

Semalt가 수백, 수천 또는 수백만 페이지가있는 웹 사이트에서 작업하고 있다고 상상해보십시오. 이 작업을 수동으로 수행해야한다면 시간이 많이 걸리고 비용이 빠르게 증가합니다. 그렇다면 어떻게 페이지를 분석하고 각 제목과 메타 설명을 최적화 할 수 있을까요? 해결책은 기계를 사용하는 것입니다. 각 페이지에서 가장 높은 순위의 키워드를 찾도록 기계를 가르치면 시간과 비용이 절약됩니다. 머신을 사용하면 데이터 입력 팀보다 더 빠르고 더 나은 성과를 얻을 수 있습니다.

Uber의 Ludwig와 Google의 T5를 다시 소개하겠습니다.

Uber의 Ludwig와 Google의 T5를 결합하면 매우 강력한 시스템을 갖게됩니다.

요약하면 Ludwig는 사용자가 코드를 작성하지 않고도 고급 모델을 학습 할 수있는 오픈 소스 자동 ML 도구입니다.

반면에 Google T5는 SERT 스타일 모델의 우수한 버전입니다. T5는 요약, 번역, 질문에 답하고 검색 쿼리 및 기타 여러 기능을 분류 할 수 있습니다. 한마디로 매우 강력한 모델입니다.

그러나 T5가 제목 태그 최적화를 위해 훈련되었다는 표시는 없습니다. 하지만 우리는 그렇게 할 수 있으며, 방법은 다음과 같습니다.
  • 다음과 같은 예제로 훈련 된 데이터 세트를 얻습니다.
    • 타겟 키워드가없는 원래 제목 태그
    • 우리의 타겟 키워드
    • 타겟 키워드로 최적화 된 제목 태그
  • 사용할 T5 조정 코드 및 자습서
  • 모델을 테스트 할 수 있도록 최적화되지 않은 일련의 제목이 있습니다.
이미 생성 된 데이터 세트로 시작하고 데이터 세트 생성 방법에 대한 가이드를 제공합니다.

T5의 작성자는 T5를 미세 조정하는 데 사용하는 자세한 Google Colab 노트북을 제공 할만큼 관대했습니다. 시간을 들여 공부 한 후 임의의 퀴즈 질문에 답할 수있었습니다. Colab 노트북에는 새로운 작업을 위해 T5를 미세 조정하는 방법에 대한 지침도 있습니다. 그러나 필요한 코드 변경 및 데이터 준비를 살펴보면 많은 작업이 필요하고 우리의 아이디어가 완벽 할 수 있음을 알게됩니다.

하지만 더 간단 할 수 있다면 어떨까요? 몇 달 전에 출시 된 Uber Ludwig 버전 3 덕분에 몇 가지 매우 유용한 기능이 결합되었습니다. Ludwig 3.0 버전은 다음과 함께 제공됩니다.
  • 모델에서 추가 성능을 도출하는 초 매개 변수 최적화 메커니즘입니다.
  • Hugging Face의 Transformers 저장소와 코드없이 통합됩니다. 이를 통해 사용자는 자연어 처리 작업을 위해 GPT-2, T5, DistilBERT 및 Electra와 같은 업데이트 된 모델에 액세스 할 수 있습니다. 이러한 작업 중 일부에는 분류 감정 분석, 명명 된 엔터티 인식, 질문 응답 등이 포함됩니다.
  • 더 새롭고 더 빠르며 모듈 식이며 TensorFlow 2에 의존하는 확장 가능한 백엔드가 있습니다.
  • Apache Parquet, TSV 및 JSON과 같은 많은 새로운 데이터 형식을 지원합니다.
  • 즉시 사용 가능한 k- 폴드 크로스 유효성 검사 기능이 있습니다.
  • Weights 및 Biases와 통합되면 여러 모델 학습 프로세스를 관리하고 모니터링하는 데 사용할 수 있습니다.
  • 노이즈 레이블을 지원하는 새로운 벡터 데이터 유형이 있습니다. 우리가 약한 감독을 다룰 때 유용합니다.
몇 가지 새로운 기능이 있지만 가장 유용한 기능 중 하나로 Hugging Face의 Transformers에 통합되었습니다. 포옹 얼굴 파이프 라인은 제목 및 메타 설명 생성에 대한 SEO 노력을 크게 개선하는 데 사용할 수 있습니다.

파이프 라인을 사용하면 이미 학습되고 모델 bub에서 이미 사용 가능한 모델에 대한 예측을 실행할 수 있습니다. 그러나 현재 필요한 작업을 수행 할 수있는 모델이 없으므로 Ludwig와 Pipeline을 결합하여 웹 사이트의 모든 페이지에 대한 강력한 자동 제목과 메타 설명을 만듭니다.

Ludwig를 사용하여 T5를 미세 조정하는 방법은 무엇입니까?

이것은 우리가 고객들에게 웹 사이트의 배경에서 일어나는 일을 정확히 보여 주려고 할 때 중요한 질문입니다. 여기에는 "T5를 교육하기 위해 Ludwig를 사용하는 것은 매우 간단합니다. 불법으로 만드는 것을 고려해야합니다."라는 진부한 표현이 있습니다. 진실은 우리가 AI 엔지니어를 고용하여 동등한 작업을 수행해야했다면 고객에게 훨씬 더 높은 비용을 청구했을 것입니다.

여기에서 T5를 미세 조정하는 방법을 확인할 수 있습니다.
  • 1 단계 : 새 Google Colab 노트북을 엽니 다. 그 후 런타임을 GPU를 사용하도록 변경합니다.
  • 이미 합쳐진 Hootsuite 데이터 세트를 다운로드합니다.
  • 그런 다음 Ludwig를 설치합니다.
  • 설치 후 학습 데이터 세트를 pandas 데이터 프레임에로드하고 어떻게 보이는지 검사합니다.
  • 그런 다음 적절한 구성 파일을 만드는 가장 중요한 장애물에 직면합니다.
완벽한 시스템을 구축하려면 T5에 대한 문서가 필요하고 제대로 될 때까지 지속적인 시행 착오가 필요합니다. (여기서 생성 할 Python 코드를 찾을 수 있다면 먼 길을 갈 것입니다.)

입력 및 출력 기능 사전을 검토하고 설정이 올바르게 선택되었는지 확인하십시오. 올바르게 수행되면 Ludwig는 't5-small'을 실행 모델로 사용하기 시작합니다. 더 큰 T5 모델의 경우 모델 허브에서 변경하기 쉽고 잠재적으로 세대를 개선 할 수 있습니다.

몇 시간 동안 모델을 훈련 한 후 인상적인 검증 정확도를 얻기 시작합니다.

Ludwig는 다른 중요한 텍스트 생성 측정, 주로 난이도 및 편집 거리를 자동으로 선택한다는 점에 유의해야합니다. 둘 다 우리에게 적절하게 맞는 낮은 숫자입니다.

훈련 된 모델을 사용하여 제목을 최적화하는 방법

모델을 테스트하는 것은 정말 흥미로운 부분입니다.

먼저 학습 중에 모델에서 볼 수 없었던 최적화되지 않은 Hootsuite 제목이 포함 된 테스트 데이터 세트를 다운로드합니다. 다음 명령을 사용하여 데이터 세트를 미리 볼 수 있습니다.

!머리

Hootsuite_titles_to_optimize.csv

Ludwig와 T5가 작은 훈련 세트로 많은 일을 할 수 있고 고급 하이퍼 파라미터 튜닝이 필요하지 않다는 것은 매우 인상적입니다. 적절한 테스트는 타겟 키워드와 상호 작용하는 방식에 달려 있습니다. 얼마나 잘 섞이나요?

Streamlight로 제목 태그 최적화 앱 빌드

콘텐츠 작성자는이 애플리케이션이 가장 유용하다고 생각합니다. 많은 기술 지식이 필요하지 않은 사용하기 쉬운 앱이 있다는 것이 놀랍지 않습니까? 글쎄, 그것이 Streamlight가 여기에있는 이유입니다.

설치 및 사용은 매우 간단합니다. 다음을 사용하여 설치할 수 있습니다.

! pip 설치 간소화

이 모델을 활용하는 앱을 만들었습니다. 필요한 경우 모델을 훈련하는 동일한 위치에서 실행하거나 이미 훈련 된 모델을 스크립트 실행을 계획하는 위치로 다운로드 할 수 있습니다. 최적화하고자하는 제목과 키워드가 포함 된 CSV 파일도 준비했습니다.

이제 앱을 시작합니다. 모델을 실행하려면 최적화 할 제목과 키워드가있는 CSV 파일의 경로를 제공해야합니다. CSV 열 이름은 Ludwig를 훈련하는 동안 이름과 일치해야합니다. 모델이 모든 제목을 최적화하지 않더라도 당황해서는 안됩니다. 적절한 숫자를 얻는 것도 큰 진전입니다.

Python 전문가로서 우리는 일반적으로 혈액을 펌핑하므로이 작업을 할 때 매우 흥분됩니다.

학습 할 사용자 지정 데이터 세트를 생성하는 방법

Hootsuite 타이틀을 사용하여 고객에게는 잘 작동하지만 경쟁사에게는 기본값이 될 수있는 모델을 교육 할 수 있습니다. 그것이 우리가 우리 자신의 데이터 세트를 생성하도록 보장하는 이유이며, 여기에 우리가하는 방법이 있습니다.
  • Google Search Console 또는 Bing 웹 마스터 도구의 자체 데이터를 활용합니다.
  • 대안으로 SEMrush, Moz, Ahrefs 등에서 고객의 경쟁 데이터를 가져올 수도 있습니다.
  • 그런 다음 제목 태그에 대한 스크립트를 작성한 다음 대상 키워드가 있거나없는 제목을 분할합니다.
  • 키워드를 사용하여 최적화 된 제목을 가져 와서 동의어로 대체하거나 제목이 "최적화되지 않도록"다른 방법을 사용합니다.

결론

Semalt 제목 태그와 메타 설명을 자동으로 최적화하는 데 도움이됩니다. 그렇게함으로써 SERP에서 앞서 나갈 수 있습니다. 웹 사이트 분석은 결코 쉬운 일이 아닙니다. 그렇기 때문에이를 위해 기계를 훈련하는 것은 비용을 절약 할뿐만 아니라 시간도 절약합니다.

Semalt에는 항상 승리를 유지할 수 있도록 데이터 세트, Ludwig 및 T5를 설정하는 전문가가 있습니다.

오늘 전화주세요.

mass gmail