텍스트마이닝을 활용한 지적재산권 트렌드 분석
2010년 부터의 특허/실용신안 등록 건수는 14년도까지 증가하다가 15년도에 급격히 감소 후, 현재까지 점진적으로 증가하고 있음
등록 주체 별로 살펴보면, 법인의 특허 등록 비율이 86%로 대부분을 차지하고 있음.
따라서 한국기업데이터 지적재산 데이터가 특허의 전체를 설명할 수는 없으나, 기술, 산업 등의 현황을 어느정도 반영할 것으로 기대해 볼 수 있음
연도별 지적재산권 등록 건수
2020년 개인/법인별 지적재산건 등록 건수
한국기업데이터에서 보유한 기업의 지적재산 정보
등록 주체 별로 살펴보면, 법인의 특허 등록 비율이 86%로 대부분을 차지하고 있음.
따라서 한국기업데이터 지적재산 데이터가 특허의 전체를 설명할 수는 없으나, 기술, 산업 등의 현황을 어느정도 반영할 것으로 기대해 볼 수 있음
포함 정보
지적재산명 / 지적재산내용 / 지적재산 종류 / 등록일자 / 기업규모
데이터 전처리
1) 특허, 실용신안 데이터만 활용
2) 지적재산 내용 결측 케이스 제외
3) 등록번호 중복 제외
지적재산 데이터의 텍스트 데이터가 ‘단어’의 형태로
분리/빈도 카운트 됨
KED코드 | 단어 | 빈도 |
---|---|---|
6 | 미생물 | 1 |
6 | 이용 | 1 |
6 | 바닐라 | 1 |
6 | 추출액 | 1 |
빈도가 높은 ‘단어’는 언급이 많이 된 중요 단어로 판단
빈도 누적 상위 50% 선택
범용 / 불용 단어 제외
KED코드 | 단어 | 빈도 |
---|---|---|
6 | 미생물 | 1 |
6 | 이용 | 1 |
6 | 바닐라 | 1 |
6 | 추출액 | 1 |
선별된 136개 키워드를 기술산업 카테고리에 분류
(WIPO 기술분류 참고)
각 기술산업 카테고리에서 빈도가 상위인 주요 키워드 선택
선택된 14개 주요 키워드와 연관 빈도가 높은 키워드 시각화
선택된 14개 주요 키워드와
연관 빈도가 높은 키워드 사이의 연결 관계 시각화
한국기업데이터 지적재산 데이터의 형태소 분석 결과, ‘방법’, ‘장치’, ‘이용’, ‘제조’ 등과 같은 일반적인 단어들이 가장 많이 언급됨
이러한 단어들은 대부분의 특허에서 범용적으로 사용하는 것으로 판단되는 단어이므로 주요키워드를 살펴보기 위해 범용/불용단어들은 제외하여 분석함
* 빈도1 : 해당 단어 언급 기업 빈도
* 빈도2 : 해당 단어의 총 언급 빈도
단어 | 빈도1 | 빈도2 |
---|---|---|
방법 | 4599 | 26359 |
장치 | 4302 | 26425 |
이용 | 2881 | 9546 |
제조 | 1979 | 12875 |
구조 | 1383 | 3237 |
구비 | 1209 | 2886 |
제어 | 1059 | 2904 |
포함 | 991 | 2852 |
단어 | 빈도1 | 빈도2 |
---|---|---|
방지 | 974 | 1860 |
조성 | 934 | 4621 |
기능 | 928 | 1723 |
자동 | 884 | 1830 |
처리 | 820 | 2562 |
조절 | 648 | 1110 |
모듈 | 565 | 1391 |
차량 | 563 | 2130 |
기술산업 분류에 키워드를 분류
단순 키워드만이 아닌 연관/구체 키워드를 함께 확인하여 가장 가까운 기술에 분류함 * 연관/구체 키워드 : 키워드와 주로 함께 출현하는 단어
상위 카테고리 | 세부 카테고리 |
---|---|
화학공학 | 화학 |
가스 / 오일 / 관련기구 | |
재료.금속학 | |
섬유.소재 | |
의약 | |
표면기술.코팅 | |
미용 | |
식료품 | |
마이크로구조.나노기술 | |
바이오기술 | |
전기공학 | 전기전자 |
통신 | |
반도체 | |
오디오.영상기술 | |
센서 | |
전기기계 | |
컴퓨터기술 / 의학 |
상위 카테고리 | 세부 카테고리 |
---|---|
기계 | 엔진.펌프.터빈 |
기계요소 | |
열처리.장치 | |
기타특수기계 | |
자동차 * WIPO에는 없는 분류이나 빈도가 높아 따로 분류함 |
차량/자동차 |
기계조작 | |
전기기계 | |
소재.섬유.제지 | |
기구 | 기구 |
광학 | |
전기 | |
미용 | |
그 외 | 환경 |
토목공학 | |
에너지 | |
나머지분야 |
→ 기술 산업별 상위 키워드 현황 확인
선별한 상위 키워드를 기술산업 카테고리로 분류하여 키워드 빈도합계를 살펴본 결과, 전기공학 / 화학공학 분야의 키워드수와 키워드 빈도량이 높게 나타남
특허청의 2020년 기술분야별 특허/실용신안 등록건수와 비교했을 때, 등록건수 역시 전기공학이 가장 높고, 화학공학과 기계 분야가 잇따르는 형태로 형태소분석 결과와 비슷한 양상을 나타내고 있음을 알 수 있음
기술산업 분류별 키워드 빈도량
2020년 기술분야별 특허·실용신안 등록
전기공학 | 전기전자 | 전지 |
---|---|---|
반도체 | 반도체 | |
센서 | 센서 | |
통신 | 통신 | |
컴퓨터기술 / 의학 | 로봇 | |
화학공학 | 가스 / 오일 | 가스 |
섬유.소재 | 수지/섬유 | |
의약 | 치료 | |
기계 | 열처리.장치 | 냉각/온도 |
자동차 | 차량/자동차 | |
기구 | 포장 | |
환경 | 공기 | |
토목공학 | 콘크리트 | |
에너지 | 태양 |
차량/자동차
수지/섬유
냉각/온도
센서
가스
통신
공기
포장
전지
반도체
콘크리트
치료
태양
로봇
14개 주요 키워드 및 연관키워드 전체를 요약하면 아래와 같은 연관관계를 확인 할 수 있음
대기업은 '금속' '전자' '통신' 등의 단어가 가장 언급이 많았고, [나노, 섬유, 네트워크] 등 의 고도화된 기술과 연관된 단어들도 상위에 언급되었음
중견/중소기업은 서로 양상이 유사하며, [반도체, 냉각, 전지, 콘크리트] 등 대기업의 협력 산업 또는 비교적 규모가 작은 산업과 관련된 키워드가 상위에 언급되었음
특히, 중소기업은 [시공, 코팅, 조명] 등 더 세부적인 품목에 대한 키워드가 상위로 언급되었음
언급량은 전기공학 > 화학공학 > 기계 > 자동차 > 기구 > 환경 > 토목공학 > 에너지 순으로 나타남 (특허청의 기술분야별 건수와 유사한 결과)
전기공학 분야 : 통신/반도체 분야의 키워드가 가장 많이 언급되었으며, 세부 키워드로는 [데이터, 발광, 소자, 디스플레이, 영상, 센서] 등이 있음
화학공학 분야 : 가스/재료.금속/섬유.소재 분야의 키워드가 가장 많이 언급되었으며, 의약/미용/식료품 등 다양한 분야의 키워드가 나타남
기계공학 분야 : 엔진.펌프.터빈/기계요소 분야의 키워드가 가장 많이 언급 되었으나, 개별 키워드로는 [냉각, 온도] 키워드가 가장 높게 나타남
자동차 분야 : [센서, 스위치, 브레이크, 블랙 박스, 하이브리드] 등의 키워드가 주로 언급이 되었음
각 기술산업별 주요 키워드로 [차량/자동차, 수지/섬유, 온도/냉각, 센서, 가스, 통신, 공기, 포장, 전지, 반도체, 콘크리트, 치료, 태양, 로봇] 이 선택됨
언급량 감소 추세 : [수지/섬유, 가스, 통신, 반도체]
언급량 증가 추세 : [센서, 전지, 치료, 로봇] / [차량/자동차] 는 지속적으로 많이 언급됨
[차량/자동차, 치료, 통신]에 대한 사회적 관심도가 가장 높으며, [공기, 포장, 로봇]에 대한 관심도 꾸준히 증가하고 있음
[차량/자동차] 키워드는 [센서, 카메라, 영상] 등의 키워드와 연관성이 나타나며, 이는 [통신, 데이터] 분야와도 연결됨.
또한 자율주행 분야로서 [로봇] 키워드와도 연결됨
[센서] 키워드는 [차량/자동차, 가스, 온도/냉각] 등 다양한 키워드와 연결이 되는 중요한 기술임
[가스]는 “반도체 설비의 과열을 처리하기 위한 냉각 가스” 등 [반도체] 산업과의 연결이 나타남
[로봇]의 경우 [수술] 분야, [수중, 소방] 등 접근이 어려운 지역 관련, [유아, 학습] 분야에 대한 키워드가 나타나는 특징이 있음
[치료]의 경우 [당뇨, 비만] 등의 질환에 대한 언급이 많았으며, [아토피, 주름, 레이저 초음파] 등 피부와 관련한 키워드 언급도 높게 나타남