사진은 고양이 두 마리. 그림자도 아니고 와치필드의 그 녀석도 아닙니다.



시작이 언제였는지는 잊었는데 얼마 전에 소설분석용 파일을 만들었습니다. 파일명 그대로, 조아라에서 연재되었던 소설의 정보를 간략하게 기록하는 겁니다. 제작목적은 '조아라 연재 소설 내에서의 성평등 정도' 확인. 정확히는 조아라에서 연재되는 판타지나 SF 등의 장르소설에서 여성의 지위가 어느 정도 될지 분석하는 것이 목적입니다. 최근에 이런 저런 일이 많아서 궁금한 김에 시작했지요. 그리고 어제 작업하고, 오늘 추가 작업해서 1차 입력은 끝냈습니다.

입력 데이터는 저자명, 소설명, 편수, 완결여부, 습작/유료전환/삭제 여부, 키워드 4종, 출처 3종입니다. 이 중 키워드는 가능한 간략하게 하여 내용 파악이 쉽게 만들었습니다. 순서는 가장 크게 소설 내용을 설명할 수 있는 것부터 그 다음 단계로 하는 것. 감으로 했기 때문에 정확하지 않지만 키워드 1은 BL, 현대, 판타지, 게임, 역사, 패러디 등의 단어가 들어갑니다. BL 키워드를 제외한 나머지는 로맨스 혹은 로맨스가 없는 판타지입니다. 그 외에 들어간 키워드는 차원이동, 환생, 회귀, 할리킹 .. 등등. 이건 나중에 따로 적어야겠네요.


기초 데이터는 매년 말, 혹은 매년 초에 작성한 올해의 조아라 소설 목록입니다. 2012년부터 시작해 2013년, 2014년, 2015년까지 작성되었습니다. 16년 것은 아직이지요. 추가되는 부분이 있지만 이건 사용하지 않을 예정입니다. 다만 내용에는 반영될 거고요.


총 4개의 기초 자료로 작성한 소설은 443편. 하지만 개중에 닉이 바뀌어 서로 다른 소설로 체크된 것이 있었기에 총 수는 441편으로 줄었습니다.


그리고 저자명 일부 수정. 닉을 바꾼 저자들은 최근의 닉을 앞에, 예전 닉을 뒤에 배치하여 한 곳에 모았습니다.



그 다음 작업은 데이터 재 추출.

현대를 배경으로 한 소설은 모두 삭제합니다. 현대 배경 소설은 오메가버스 설정이라도 삭제. 현대배경의 소설은 현실을 반영하다보니 아무래도 저자의 영향력이 떨어지는 편일거라 보았습니다. 분석 관찰하고 싶은 대상이 무의식적인 성차별이 소설 속에서 발현되는 가의 여부라서 현대는 제외하는 것이 좋겠더군요. 물론 넣고 분석해도 되지만 이번은 제외합니다.


그런 고로 현대 삭제한 뒤에 다시 오겠습니다? (160815 1110)



키워드 1: 현대 4건 삭제(반월당, 서울 박물지, 그녀와 행복하세요, 당신의 스토커)

키워드 2: 현대 38건 삭제. 이중 불청객은 키워드가 판타지, 현대, 빙의로 들어갔는데 현대, 빙의로 수정할 것. 이러면 키워드 1이 5건으로 증가. 키워드 2는 37건. 검토 후 전체 삭제.

키워드 3, 키워드 4는 현대 없음.


따라서 현대 키워드의 전체 삭제 건수는 42건임.



역사 키워드 삭제.

키워드 1에서 역사 키워드가 들어간 것은 빅토리안 시대를 배경으로 한 안개 도시 모음곡과 아서왕 설화의 패러디인 킹 아더, 그리고 아더임. 이 둘도 삭제.


그리스신화 키워드 삭제

키워드 2에서 그리스신화가 들어간 두 건은 바위산의 신부, 괴물의 신부임. 둘 다 프시케 설화를 기반으로 했다고 기억하는데, 둘 다 삭제.


여기까지 하면 도합 395건의 데이터가 남습니다.-ㅁ-




그다음 단계. 데이터 2차 정제.

앞이 키워드에 근거해 분석 제외 소설을 거른 단계라고 하면 이번은 기억에 의존합니다. 다시 말해 읽었다고 기록은 되어 있지만 기억이 안나는 소설을 삭제합니다.

바로 삭제하는 것은 아니고, 이번에는 셀 색을 다르게 하여 체크했다가 한 번에 정리합니다.


그러기 위해 분석가부 탭을 하나 만들어 분석이 불가능한 소설에 2를 기입합니다. 필터링하면 쉽게 처리할 수 있습니다. 여기서 걸러내는 것은 내용을 기억하지 못하는 소설입니다.

그 다음에는 분석제외 탭을 추가합니다. 여기서는 내용은 기억하되, 성평등 문제를 판가름할 정보가 없는 소설을 기입합니다. 단, 이것은 추가만 하고 제외는 그 다음 단계에서 진행합니다.



160815 1353

... 만, 작업 정리하다보니, 젠장. 아이돌 소설에는 현대 키워드를 안 넣었네요. 이것부터 수정하고..(주섬주섬)

그리하여 아이돌 키워드가 들어간 9개 소설은 추가 삭제.

그리고 혹시나 싶어 확인하니 연기 키워드를 입력한 건 하나도 현대를 추가하지 않아서 추가 후 삭제. raw 데이터 말고 1차 수정 작업 데이터는 이에 맞춰 수정해둡니다.

그리하여 10건이 줄어 최종 데이터 385건.



16시 22분 추가.

오늘은 일단 분석제외 대상 코드 2-기억나지 않아서 못하겠어요 체크까지만 진행합니다.

코드 3인 분석대상에서 제외합니다는 다음 기회에. 제대로 하려면 이거, 아예 해당 자료 각각에 대한 해설을 덧붙여야 할 것 같아서.OTL 그렇게 하지 않으면 설명이 안됩니다. 으하하학;ㅂ; 해설을 빼고 점수만 매기는 방법도 있는데 해설을 넣어야 제 자신도 납득이 되겠더라고요. 아니면 다음 번에 동일 분석을 할 때 같은 값이 안나올 겁니다. 안그래도 자의적인 기준이라 .....

+ Recent posts