ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • 프로그래머스. 2021 KAKAO BLIND RECRUITMENT. 신규 아이디 추천(파이썬)
    IT/알고리즘 해설 2021. 9. 29. 23:27
    728x90
    SMALL

    문제 설명

    카카오에 입사한 신입 개발자 네오는 "카카오계정개발팀"에 배치되어, 카카오 서비스에 가입하는 유저들의 아이디를 생성하는 업무를 담당하게 되었습니다. "네오"에게 주어진 첫 업무는 새로 가입하는 유저들이 카카오 아이디 규칙에 맞지 않는 아이디를 입력했을 때, 입력된 아이디와 유사하면서 규칙에 맞는 아이디를 추천해주는 프로그램을 개발하는 것입니다.
    다음은 카카오 아이디의 규칙입니다.

    • 아이디의 길이는 3자 이상 15자 이하여야 합니다.
    • 아이디는 알파벳 소문자, 숫자, 빼기(-), 밑줄(_), 마침표(.) 문자만 사용할 수 있습니다.
    • 단, 마침표(.)는 처음과 끝에 사용할 수 없으며 또한 연속으로 사용할 수 없습니다.

    "네오"는 다음과 같이 7단계의 순차적인 처리 과정을 통해 신규 유저가 입력한 아이디가 카카오 아이디 규칙에 맞는 지 검사하고 규칙에 맞지 않은 경우 규칙에 맞는 새로운 아이디를 추천해 주려고 합니다.


    신규 유저가 입력한 아이디가 new_id 라고 한다면,

    1단계 new_id의 모든 대문자를 대응되는 소문자로 치환합니다.

    2단계 new_id에서 알파벳 소문자, 숫자, 빼기(-), 밑줄(_), 마침표(.)를 제외한 모든 문자를 제거합니다.

    3단계 new_id에서 마침표(.)가 2번 이상 연속된 부분을 하나의 마침표(.)로 치환합니다.

    4단계 new_id에서 마침표(.)가 처음이나 끝에 위치한다면 제거합니다.

    5단계 new_id가 빈 문자열이라면, new_id에 "a"를 대입합니다.

    6단계 new_id의 길이가 16자 이상이면, new_id의 첫 15개의 문자를 제외한 나머지 문자들을 모두 제거합니다. 만약 제거 후 마침표(.)가 new_id의 끝에 위치한다면 끝에 위치한 마침표(.) 문자를 제거합니다.

    7단계 new_id의 길이가 2자 이하라면, new_id의 마지막 문자를 new_id의 길이가 3이 될 때까지 반복해서 끝에 붙입니다.

     

    해설

    이 문제는 주어진 string에 대해서 정규 표현식을 적용해서 string을 가공하는 문제이다.

    따라서 정규표현식에 대해서 알고 있어야 한다.

    import re
    
    def solution(new_id):
        new_id = new_id.lower()
        
        new_id = re.sub('[^a-z0-9-_.]', '', new_id)
        
        new_id = re.sub('[.]{2,}', '.', new_id)
        
        new_id = re.sub('^[.]', '', new_id)
        new_id = re.sub('[.]$', '', new_id)
        
        new_id = 'a' if len(new_id) == 0 else new_id
        
        new_id = new_id[0:15] if len(new_id) >= 16 else new_id
        new_id = re.sub('[.]$', '', new_id)
        
        new_id += new_id[-1]*(3-len(new_id)) if len(new_id) <= 2 else ""
        
        return new_id

    코드를 살펴보자. 단계별로 정규표현식이나 로직을 적용하여 string을 가공해야한다.

     

    1단계.

    모든 대문자를 소문자로 치환해야한다. 이는 파이썬에서 자체 제공하는 lower() 메소드를 활용하면 모두 소문자로 바꿀 수 있다.

     

    2단계.

    알파벳 소문자, 숫자, 빼기(-), 밑줄(_), 마침표(.)를 제외한 모든 문자를 제거해야 한다.

    이 때, 정규표현식 모듈인 re를 사용한다. sub는 문자열을 치환해주는 메소드이다. 여기에 parameter로 패턴, 치환할 패턴, 치환할 문자열을 차례대로 넣어주면 된다. 이 때, 패턴으로 ^를 사용했다. ^는 not의 의미로 ^뒤에 있는 패턴들을 제외하게된다. [] 는 문자열을 의미하므로, 문자열에서 a-z(알파벳 소문자), 0-9(숫자), -(빼기), _(언더바), .(점) 을 제외한 모든 문자열 패턴을 의미하게된다. 따라서, 해당 문자열들을 제외한 모든 문자에 대해서 빈 문자열로 바꿔주었다.

     

    3단계.

    .이 2개 이상 있으면, . 하나로 바꾸어야 한다. 여기서는 {}을 사용해서 2번 이상 반복된 . 문자열에 대해서 . 하나로 바꿔주도록 하였다.

     

    4단계.

    ^이 [] 앞에 있으면, 문자열의 시작을 의미한다. 처음부터 차례대로 보겠다는 의미이다. [.] 이므로, 문자열의 처음부터 . 하나를 검사한다.

    .이 문자열의 맨 처음에 있으면 ''로 바꿔준다.

    $는 문자열의 마지막을 의미한다. 따라서 마지막에서부터 차례대로 검사한다. 마지막에 .이 있는지 검사한 후, 있다면 ''로 치환해준다.

     

    5단계.

    new_id가 빈 문자열이라면 'a'를 삽입해주어야 하므로, if문으로 new_id의 길이를 검사해준다.

    파이썬에서는 조건문을 한줄로 표현할 수 있다. if문 앞에는 if 조건이 참일 경우 수행할 로직이 들어가고, else 뒤에는 거짓일 경우 수행할 로직이 들어간다. 따라서 len(new_id)가 0일 경우 new id에 'a'를 대입하고, 아니라면 그대로 new_id를 넣는다.

     

    6단계.

    5단계와 마찬가지로 new_id의 length를 검사한다. len(new_id)가 16이상일 경우 new_id의 0~15번째 문자열만 슬라이싱해서 new_id에 넣어준다. new_id[0:15]는 0~14번째 인덱스에 있는 문자만 가져오겠다는 뜻이다.

    그 후, 마지막에 .가 존재한다면 ''로 치환해주어야 하므로, 5단계에서처럼 $를 사용해서 가져온다.

     

    7단계.

    마지막은 new_id의 length가 2이하면, length가 3이 될 때까지 마지막 문자를 반복해서 넣어주어야 한다.

    new_id[-1]로 마지막 문자를 가져온 후, 3에서 new_id의 length를 뺀 값 만큼 반복해주었다. 파이썬 문자열의 반복은 *로 할 수 있다.

    따라서, new_id[-1]*(3-len(new_id))로 마지막 문자를 반복해준 후, new_id에 더해주면 만들 수 있다.

     

    이렇게 7단계까지 거친 new_id를 return 해주면 된다.

     

    level1 문제로 어려운 문제는 아니었는데, 사실 정규표현식을 공부하는 것 자체가 너무 귀찮아서 공부를 안했더니 굉장히 번거로운 문제가 되었다. 정규표현식만 또 따로 열심히 연습을 해보아야겠다.

     

    이 문제를 푸는데 가장 도움이 됐던 사이트 : https://swlock.blogspot.com/2019/06/import-re-string-regular-expression-in.html

     

    파이썬에서 정규 표현식(정규식)으로 문자열 추출(import re) String regular expression in Python

    re Python 파이썬에서 정규 표현식으로 문자열 추출할 수 있는 것은 re 모듈입니다. 용도 문자열에서 일정한 패턴의 문자열을 찾기 위해서 사용합니다. 많이 사용하기 때문에 많은 예제와 완벽하게

    swlock.blogspot.com

    정규표현식 패턴에 대해서 가장 간결하게 잘나와있어서 풀 수 있었다.

    728x90
    LIST

    댓글

Designed by Tistory.