목록2024/04 (28)
minkylee
문제크기가 N X N 인 도시가 있고 집과 치킨집이 주어진다. M개의 치킨집을 남기고 모두 폐업시키려고 할 때 도시의 치킨 거리의 최소값을 구해라치킨거리 : 집과 가장 가까운 치킨집 사이의 거리, 각각의 집은 치킨 거리를 가지고 있다.도시의 치킨 거리 : 모든 집의 치킨 거리의 합이다.예를 들어, 아래와 같은 지도를 갖는 도시를 살펴보자.0 2 0 1 01 0 1 0 00 0 0 0 00 0 0 1 10 0 0 1 20은 빈 칸, 1은 집, 2는 치킨집이다.(2, 1)에 있는 집과 (1, 2)에 있는 치킨집과의 거리는 |2-1| + |1-2| = 2, (5, 5)에 있는 치킨집과의 거리는 |2-5| + |1-5| = 7이다. 따라서, (2, 1)에 있는 집의 치킨 거리는 2이다.(5, 4)에 있는 집과 ..
문제LCS(Longest Common Subsequence, 최장 공통 부분 수열)문제는 두 수열이 주어졌을 때, 모두의 부분 수열이 되는 수열 중 가장 긴 것을 찾는 문제이다.예를 들어, ACAYKP와 CAPCAK의 LCS는 ACAK가 된다LCS LCS는 DP 알고리즘의 대표적인 문제이다.사실 브루트포스로도 풀 수 있는데 부분 문자열을 모두 구하고 비교해야 하므로 시간복잡도가 $2^n$ 인 무시무시한 숫자가 나온다. 두 개의 문자열을 A, B라고 하자,현재 보고있는 문자가 A[i] 와 B[j] 일 때, A[i]와 B[j] 가 같을 경우 최장 공통 부분 수열은 A[i - 1] B[j - 1]까지의 최장공통 부분 수열에 현재 문자를 더한 것과 같다. ABC 와 BC라는 실제 문자열을 가지고 생각해보자 현재..
Lie Factor는 데이터 시각화에서 사용되는 개념으로 시각적으로 표현된 데이터가 얼마나 실제 데이터의 비율을 왜곡하고 있는지를 나타내는 척도이다. 간단히 말해서, 시각화된 정보가 실제 데이터를 얼마나 정확하게 또는 부정확하게 나타내는지를 측정하는 방법 Effect Size in Graphic 은 시각화된 변화의 비율 (예를 들어, 그래프에서의 길이, 면적, 각도의 변화 등)Effect Size in Data는 실제 데이터에서의 변화 비율Lie Factor의 의미Lie Factor = 1 : 시각화가 데이터를 정확하게 표현하고 있음을 의미한다.Lie Factor > 1 : 시각화가 데이터보다 큰 효과를 주는 것처럼 표현되고 있어, 데이터를 과장하고 있음을 의미한다.Lie Factor..
데이터 프레임 메서드 info() 메서드데이터 프레임을 로딩한 후 가장 먼저 실행하는 명령어 중 하나데이터셋에 대한 필수적인 세부사항 제공행과 열의 수 : 데이터 프레임에 몇 개의 행과 열이 있는지 표시한다.non-null의 수 : 각 열에 있는 nonnull의 개수를 보여준다.열의 타입 : 열의 타입 : 각 열의 데이터 타입을 보여준다. (예. 정수, 실수, 문자열 등)메모리 사용량 : 데이터프레임이 메모리에서 차지하는 용량shape 메서드append()한 데이터 프레임을 다른 데이터 프레임에 추가한다.원본 데이터프레임을 변경하지 않고, 두 데이터프레임을 결합한 새로운 데이터프레임을 복사본으로 반환temp_df = movies_df.append(movies_df, movie..
판다스의 Dataframe은 다음과 같은 인수를 가진다. pandas.DataFrame(data, index , columns , dtype , copy ) Data : ndarray, series, map, lists, dict, 상수 및 다른 Dataframe까지 올 수 있다.index : 결과 프레임에 사용할 행 레이블, 입력하지 않은 경우 기본값으로 np.arrange(n) 값이 온다.columns : 행 레이블, 기본값은 np.arrange(n)이다. dtype : 행 레이블의 데이터 타입copy : 데이터를 복사할 때 쓴다. 기본값은 FalseSerise를 사용해서 Dataframe 만들기 시리즈 객체를 만든다.import datetime as dtimport num..
판다스 (Pandas)는 파이썬 데이터 처리를 위한 라이브러리이다. 파이썬을 이용한 데이터 분석과 같은 작업에서 필수 라이브러리로 알려져 있다. Pandas라는 이름은 "Panel Data" 와 "Python Data Analysis" 의 합성어이다. NumPy 저수준 데이터 구조(np.array) 대규모 다차원 배열 및 행렬 지원 광범위한 수학적 배열 연산 Pandas NumPy 기반으로 만들어진 RDMS(관계형 데이터 베이스)_Table 형태의 데이터 셋이다. 2차원 Table 형태로 다양한 칼럼(차원)을 관리할 수 있도록 만들어졌다. Dependencies: The Python Stack 시리즈(Series) 시리즈 클래스는 1차원 배열의 값(values)에 각 값에 대응되는 인덱스를 부여할 수 있..
많은 숫자 데이터를 하나의 변수에 넣고 관리 할 때 리스트는 속도가 느리고 메모리를 많이 차지하는 단점이 있다. 배열 (array)를 사용하면 적은 메모리로 많은 데이터를 빠르게 처리할 수 있다. 배열은 리스트와 비슷하지만 다음과 같은 점에서 다르다. 모든 원소가 같은 자료형이여야 한다. 원소의 갯수를 바꿀 수 없다. 파이썬은 자체적으로 배열 자료형을 제공하지 않는다. 따라서 배열을 구현한 다른 패키지를 임포트해야한다. 파이썬에서 배열을 사용하기 위한 표준 패키지는 넘파이(NumPy)이다. 넘파이 넘파이는 수치해석용 파이썬 패키지이다. 다차원의 배열 자료구조 클래스인 ndarray 클래스를 지원하며 벡터와 행렬을 사용하는 선형대수 계산에 주로 사용된다. 넘파이의 배열 연산은 C로 구현된 내부 반복문을 사..
문제 알파벳 소문자로 구성된 길이 1 이상의 두 문자열 X, Y가 있다. 이 문자열들의 임의의 위치에 공백을 삽입하여 두 문자열의 길이를 같게 만든 다음, 앞에서부터 한 글자씩 살펴보면서, 같은 위치에 있는 두 문자 X[i], Y[i]에 대해서 다음과 같이 점수를 계산한다. 두 문자가 같은 경우에는 A(> 0)점을 받게 된다. 단, 두 문자가 모두 공백인 경우는 허용되지 않는다. 두 문자 중 적어도 하나가 공백인 경우에는 B(< 0)점을 받게 된다. 두 문자가 모두 공백이 아니고 서로 다른 경우에는 C(< 0)점을 받게 된다. 입력 첫째 줄에 세 정수 A, B, C (0 < A ≤ 10,000, -10,000 ≤ B, C < 0) 가 주어진다. 그리고 둘째 줄에 X가, 셋째 줄에 Y가 주어진다. 각 문자..