-
프로그래머스. 2021 KAKAO BLIND RECRUITMENT. 신규 아이디 추천(파이썬)IT/알고리즘 해설 2021. 9. 29. 23:27728x90SMALL
문제 설명
카카오에 입사한 신입 개발자 네오는 "카카오계정개발팀"에 배치되어, 카카오 서비스에 가입하는 유저들의 아이디를 생성하는 업무를 담당하게 되었습니다. "네오"에게 주어진 첫 업무는 새로 가입하는 유저들이 카카오 아이디 규칙에 맞지 않는 아이디를 입력했을 때, 입력된 아이디와 유사하면서 규칙에 맞는 아이디를 추천해주는 프로그램을 개발하는 것입니다.
다음은 카카오 아이디의 규칙입니다.- 아이디의 길이는 3자 이상 15자 이하여야 합니다.
- 아이디는 알파벳 소문자, 숫자, 빼기(-), 밑줄(_), 마침표(.) 문자만 사용할 수 있습니다.
- 단, 마침표(.)는 처음과 끝에 사용할 수 없으며 또한 연속으로 사용할 수 없습니다.
"네오"는 다음과 같이 7단계의 순차적인 처리 과정을 통해 신규 유저가 입력한 아이디가 카카오 아이디 규칙에 맞는 지 검사하고 규칙에 맞지 않은 경우 규칙에 맞는 새로운 아이디를 추천해 주려고 합니다.
신규 유저가 입력한 아이디가 new_id 라고 한다면,1단계 new_id의 모든 대문자를 대응되는 소문자로 치환합니다.
2단계 new_id에서 알파벳 소문자, 숫자, 빼기(-), 밑줄(_), 마침표(.)를 제외한 모든 문자를 제거합니다.
3단계 new_id에서 마침표(.)가 2번 이상 연속된 부분을 하나의 마침표(.)로 치환합니다.
4단계 new_id에서 마침표(.)가 처음이나 끝에 위치한다면 제거합니다.
5단계 new_id가 빈 문자열이라면, new_id에 "a"를 대입합니다.
6단계 new_id의 길이가 16자 이상이면, new_id의 첫 15개의 문자를 제외한 나머지 문자들을 모두 제거합니다. 만약 제거 후 마침표(.)가 new_id의 끝에 위치한다면 끝에 위치한 마침표(.) 문자를 제거합니다.
7단계 new_id의 길이가 2자 이하라면, new_id의 마지막 문자를 new_id의 길이가 3이 될 때까지 반복해서 끝에 붙입니다.
해설
이 문제는 주어진 string에 대해서 정규 표현식을 적용해서 string을 가공하는 문제이다.
따라서 정규표현식에 대해서 알고 있어야 한다.
import re def solution(new_id): new_id = new_id.lower() new_id = re.sub('[^a-z0-9-_.]', '', new_id) new_id = re.sub('[.]{2,}', '.', new_id) new_id = re.sub('^[.]', '', new_id) new_id = re.sub('[.]$', '', new_id) new_id = 'a' if len(new_id) == 0 else new_id new_id = new_id[0:15] if len(new_id) >= 16 else new_id new_id = re.sub('[.]$', '', new_id) new_id += new_id[-1]*(3-len(new_id)) if len(new_id) <= 2 else "" return new_id
코드를 살펴보자. 단계별로 정규표현식이나 로직을 적용하여 string을 가공해야한다.
1단계.
모든 대문자를 소문자로 치환해야한다. 이는 파이썬에서 자체 제공하는 lower() 메소드를 활용하면 모두 소문자로 바꿀 수 있다.
2단계.
알파벳 소문자, 숫자, 빼기(-), 밑줄(_), 마침표(.)를 제외한 모든 문자를 제거해야 한다.
이 때, 정규표현식 모듈인 re를 사용한다. sub는 문자열을 치환해주는 메소드이다. 여기에 parameter로 패턴, 치환할 패턴, 치환할 문자열을 차례대로 넣어주면 된다. 이 때, 패턴으로 ^를 사용했다. ^는 not의 의미로 ^뒤에 있는 패턴들을 제외하게된다. [] 는 문자열을 의미하므로, 문자열에서 a-z(알파벳 소문자), 0-9(숫자), -(빼기), _(언더바), .(점) 을 제외한 모든 문자열 패턴을 의미하게된다. 따라서, 해당 문자열들을 제외한 모든 문자에 대해서 빈 문자열로 바꿔주었다.
3단계.
.이 2개 이상 있으면, . 하나로 바꾸어야 한다. 여기서는 {}을 사용해서 2번 이상 반복된 . 문자열에 대해서 . 하나로 바꿔주도록 하였다.
4단계.
^이 [] 앞에 있으면, 문자열의 시작을 의미한다. 처음부터 차례대로 보겠다는 의미이다. [.] 이므로, 문자열의 처음부터 . 하나를 검사한다.
.이 문자열의 맨 처음에 있으면 ''로 바꿔준다.
$는 문자열의 마지막을 의미한다. 따라서 마지막에서부터 차례대로 검사한다. 마지막에 .이 있는지 검사한 후, 있다면 ''로 치환해준다.
5단계.
new_id가 빈 문자열이라면 'a'를 삽입해주어야 하므로, if문으로 new_id의 길이를 검사해준다.
파이썬에서는 조건문을 한줄로 표현할 수 있다. if문 앞에는 if 조건이 참일 경우 수행할 로직이 들어가고, else 뒤에는 거짓일 경우 수행할 로직이 들어간다. 따라서 len(new_id)가 0일 경우 new id에 'a'를 대입하고, 아니라면 그대로 new_id를 넣는다.
6단계.
5단계와 마찬가지로 new_id의 length를 검사한다. len(new_id)가 16이상일 경우 new_id의 0~15번째 문자열만 슬라이싱해서 new_id에 넣어준다. new_id[0:15]는 0~14번째 인덱스에 있는 문자만 가져오겠다는 뜻이다.
그 후, 마지막에 .가 존재한다면 ''로 치환해주어야 하므로, 5단계에서처럼 $를 사용해서 가져온다.
7단계.
마지막은 new_id의 length가 2이하면, length가 3이 될 때까지 마지막 문자를 반복해서 넣어주어야 한다.
new_id[-1]로 마지막 문자를 가져온 후, 3에서 new_id의 length를 뺀 값 만큼 반복해주었다. 파이썬 문자열의 반복은 *로 할 수 있다.
따라서, new_id[-1]*(3-len(new_id))로 마지막 문자를 반복해준 후, new_id에 더해주면 만들 수 있다.
이렇게 7단계까지 거친 new_id를 return 해주면 된다.
level1 문제로 어려운 문제는 아니었는데, 사실 정규표현식을 공부하는 것 자체가 너무 귀찮아서 공부를 안했더니 굉장히 번거로운 문제가 되었다. 정규표현식만 또 따로 열심히 연습을 해보아야겠다.
이 문제를 푸는데 가장 도움이 됐던 사이트 : https://swlock.blogspot.com/2019/06/import-re-string-regular-expression-in.html
정규표현식 패턴에 대해서 가장 간결하게 잘나와있어서 풀 수 있었다.
728x90LIST'IT > 알고리즘 해설' 카테고리의 다른 글
프로그래머스. 메뉴 리뉴얼 파이썬 풀이 (0) 2021.10.22 백준 1707. 이분 그래프 (파이썬) (0) 2021.10.08 백준 1038. 감소하는 수 (파이썬) (0) 2021.09.23 프로그래머스 2020 카카오 인턴 - 키패드 누르기 해설 (파이썬) (0) 2021.09.14 백준 1010. 다리 놓기 (파이썬) (2) 2021.09.12