Tabla de contenidos
- Альгебра Линаал
- Эскаларес
- Вектор
- Матрицы
- Tensores.
- HiperPlanos
- Операции Matemáticas относится
- Продукты-де-Пунто (точечный продукт)
- Продукт Adamard (элемент-мудрый продукт)
- Tensor Producto (внешний продукт)
- Эстадица
- Вероятно
- Веробабидад против Пособилидада
- Bayesianos против частостистас
- Веробабидад
- Теорема де Бэйс
- Веробабидада задний
- Дистрибуция
- Теорема дель Ограниченный Центральный
- Muestras против Población.
- Métodos de Re-Muestreo
- Sesgo de Selección.
- Posibilidad.
- Вероятно
Эскаларес
EN Matemáticas, Cuando El Termino Escalar Es Mencionado, Estamos Hablando de Elementos en vector un. ООН Escalar es un número Real y un newelso en un campo usado para diftir el espacio vicorial.
Ru Computación, El Termino Escalar Es Sinónimo Con El Termino Переменная Y Su Locación de Almacenamiento Emparejado Con Nombre Simbólico. Esta Locación de Almacenamiento Mantiene Una Cantidad desconocida de Información llamada Валир Отказ
Вектор
Para Nuestro Uso, определенный вектор ООН Como Lo Siguiente:
Para Un Integral Positivo RU , ООН вектор es en n -тапель, ООН (много) набор o Array de n Números, Llamados Elementos o Escalares.
Lo que astamos diediendo es es queemos crage una estructura de ditos llamada vector través de un preceso llamado Векторные . El Número de Elementos El El Vector Es llamado “orden” (O “Longitud”) del Vector. Vectores Vectores También PueDen Chean Puntos en uns espacio de n -димяния. En El Sentido Espacial, La Distancia Euclideana Desde el origen Al Punto представила Por El Vector Nos da la “Longitud” del vector.
EN TEXTO MATEMATICO, VEMOS A a Vectores Escritos ASI:
Hay Loadas Maneras Diferentes de Manejar La Vectización, Y Se PuEden Applear Pubeos Pasos De Preprocesamiento, Dando Diferentes Grados de Efectividade En Los Resultaldos Del Modelo.
Матрицы
Рассматривать Уна Матрис Комо ООН Групо де вектора El Que Todos Tienen La Misma Groubión (Número de Columnas). De esta manera una matriz en un uns arable de dos dimsenses para eel cual tenemos filas y columnas.
Si Nuestra Matriz Debe Ser de Tamaño n х м , Тиэн n Филас y м столбец.
Tensores.
ООН тензор ES Armay MultiDimence Al Nivel Más фундаментальный. Más una estructura Matematica General que que uns vector. SE Puede Ver Vectores Como Una Subclase de Tensores.
Tensores, Las Filas Se extenden a lo largo del eje y y las columnas a lo largo del eje x . CADA EJE ES UNA GRASENON, Y LOS TESSORES TIENEN IMENSIONS ADIALES. Лос-Tensores También Tienen un Rango. Сравнить, ООН Escalar ES DE RANGO 0 Y ООН Vector Es Rango 1. También SE Puede ver que una matriz es de rango 2. Custquier Entidad de Rango 3 Y Superious Es Tensor ES Tensor.
HiperPlanos
Otro objeto de álgebra lineal del que debemos estar al tanto es эль HiperPlano Отказ En El Campo de la Geometría, El Hiperplano ES UN Subespacio de Una Groupión Menos Que Su Espacio Ambiental. En uns espacio de tres dimensions, Los Hiperplanos Deben Tener dos dos dossensions. Ru uns espacio de dos divensions SE Учитывает установку NAA Linea de Una Dimension Como El Hiperplano.
ООН Hiperplano ES UNA Construcción Matemática Que Divide EN n ESPACIOS STARROUNES EN «PATHES» SELADAS Y POR LO TANTO ES UTIL EN APLEPACIONES COMO CLASIFIFACION.
Optimizar Los Parámetros del Hiperplano ES Concepto Central EN Modelado Lineal.
Операции Matemáticas относится
Продукты-де-Пунто (точечный продукт)
Una Operación Central de la Algebra line que se ve muy seguido en machine Узнать EL Producto de punto. . EL Producto de punto es llamado veces como “Продукт эскалар” O “Producto Interno”. Este Producto Toma DOS вектор де ла Misma Longitud Y DeveLve Solo Número. ESTO SE HACE Combinando Las EntraDas En Los DOS Vocores, Multiplicándolas y luego Sumando Los Productos Así Obtenidos. SIN PONERE MUY MATEMATICO (INMEDATAMEAMESTAMEAMESTEAMESE), ES GEEATE Mencionar Que Este Solo Número Codififica Blacea Informacion.
Para Empezar, EL Producto de Punto Es Una Medida de Cuan Grands Son Los Elementos Индивидуальные люди EN CADA VECOR. VOS Vectores Con Valores Bastante Grandes PueDen Dar RestutaDos Grandes, Y VOS VOS Valos Con Valores Bastante Chicos Van Har Valores Chicos. CuAndo Los Valores Relativos de Estos Vectores Son Contabilizados MateMáticamente Con Algo Llamado Normalización. , EL Producto de Punto Es Una Medida de Cuan подобно векторным векам ESTOS. ESTA Nocion Matemática de un producto de punto de dos Вектор Normalizados es llamada Similitud Coseno Отказ
Продукт Adamard (элемент-мудрый продукт)
Otra Operación Comun En La álgebra Lineal Que Se Ve en la práctica es el Producto Adamard (ES La Mejor Traduccion Que Encontre). ESTA Operación Toma DOS вектор de la misma longitud y vector vector vector de la misma longitud con cada elemento consecente multiplicados juntos de los dos vocores Оригинал.
Tensor Producto (внешний продукт)
ESTO ES CONOCIDO COMO EL “PROFFORE TESSOR” DE DOS vectores de entrada. Tomamos Cada Elemento de Una Columna del Vector y lo multiLicamos por todos los rementos en la fila del vector creando una nueva fila en la matriz resultance.
Ahora Vamos Repasar Tres Conceptos Básicos Ru Estadística, Estos Son:
- Вероятностные
- Дистрибуция
- Posibilidades.
También Hay Otros Conceptos Que Me Gustaria Risaltar de Estadística Descriptiva y Estadística IndeShial. ESTADística Descriptiva включает:
- Гистограммы
- Баллон
- Рассеяния
- Промедия
- Desviiación estándar.
- Современные де-корреляцион
ESTO Contrasta Con La Forma En Que La Estadística Indexial SE OCUPA DE LAS TÉCNICAS PARA HELTERIZAR DE UNA MUESTRA A UNA POBLACION. Continuación, Se Muestran Algunos Ejemplos de Estadísticas Inferexiales:
- Договор
- Интерфейс де КОНФАНЗА
La Relación Entre Resbabilidad y Estadística IndeShial:
- Razonamiento Probabilistico de la población a la muestra (razonamiento dedccivo)
- Razonamiento Estadístico Indexial de la muestra a la población
Antes de que podamos entender lo que una muestra epsifica Nos Dice Sobre La Población Оригинал, Necesitamos Entender La Incertidumbre Asociada Tomar Una Muestra de Una Población Dada.
Вероятно
Определенный La Probabilidad de un Evento Е COMO ООН Нумеро на entre 0 y 1. En Este Contexto, EL Valor 0 Infiere Que El Evento Е нет шансов Тиэна де ocurrir, y El Valor 1 значимость Que El Evento Е VA Ocurrir Con Seguridad. MULLYS VECES VEREMOS A LA RSIBALIDAD EXPRESADA COMO ООН NúMERO DECIMAL, PERO TAMBIÉN PODEMOS EXPRESARLO COMO ООН Porcentaje Entre 0 у 100%. EJEMPLO PODRIAA SER UNA VRABALIDAD DE 0.35 EXPRESADO COMO 35 POR CIETO (0,35 X POR CIETO).
El Ejemplo Canónico de Medir La Probabilidad Es Обсерженные изделия CUANTAS VECES UNA MONEDA CAE EN CARA O EN CRUZ (POR EJEMPLO, 50% DE CADA LADO). La Resbabilidad del Espacio Muestral ES Siempre 1 Porce Esto Представитель Тодос Лос-Поселе Регенерадос Para Una Dentinanada Prueba. COMO PodeMos Ver Con Los Dos Resultados («Cara» Y “Cruz”) Para La Moneda Lanzada, 0.50 + Porveque La Probabilidad Total Del Espacio Muestral Siempre Debe Russian En 1. SE expresa la probabilidad de un evento de la siguiente manera:
- P (E) .5
Y se lee como: la probabilidad del evento E 0,5
Веробабидад против Пособилидада
Mouseas Veces Personas que apenas comienzan en la estadística o El Artrendizaje Automático PuEden Contundir El Contrainaado de Probabilidad Y Posibilidad. Antes de Seguir, Vamos a dejar en claro que:
- P (E) знак равно (Шансы де очеле Е ocurra)/Шансы
VEMOS ESTO EL E EJEMPLO de Tomar Un AZ (DE 4) de un Mazo de 52 Cartas Donde Obtenemos Esto:
- 4/.077
POR LO TANTO, Posibilidades SE Определите COMO:
- (Шансы де очеле Е ocurra): (Шансы де que E Нет ocurra)
AHORA, EL EJEMPLO DE LA CARTA SE CORVIERTE EN “LAS POSIBILIDADS de Tomar un az”:
- 4: (52 -/.083333333333 …
La Ganual Diverencia Aqui Es La Eleccion del Denominador (шансы Всего шансов против шансов в astos astos ucurra) haciendo que estos dos sean dos concepts diferentes en astadística.
La Probabilidad SE Encuentra El Centro de Las Redes Neuronles Y El Artrendizaje profundo por su rol en extraacción de caracteristicas y clazififación, Dos de las Industres Funciones de Redes Neurolles Profundas.
AUN Más Probabilidad: Bayesianos против частостистаса
Hay Dos Correices Ticanents Doctro de la Estadística lmaidas Bayesianismo y частотеремё Отказ La Diferencia Básica Entre Las CoreRientes Es Cómo Probabilidad EsoftiDa.
Con Los Completexistas, Probabilidad Solo Tiene Citco Citcoucdo El Contexto de Repetir Una Medición. Cuando Medimos Algo, Veremos Pequeñas Variaciones Dadas Los Cambios en El Equipo que Utilizamos Para Recolectar Datos. Si Medimos Algo Un Buen Número de Veces, La Frecuencia del Valor Dado Inda La Probabilidad de Medir Ese Valor.
Con El Enfoque Bayesiano, AmpliMos La Idea de Verbabilidad Para Cubrir Aspectos de Certeza Sobre Decalaciones. La Restabilidad Nos Da Una Takenación de Nuestro Conocimiento Sobre Cuál Será El Restulactado de la Medición. Para Los Bayesianos, Nuestro Conocimiento Sobre Un Evento Es Fundamentalmente Relacionado Com La Probabilidad.
Los Chastextistas Confían en Pubeos, Mouseos Ensayos Ancegas de un Expearimentio Antes de Hacer Decariance Sobre La Perivación de Una переменная. Los Bayesianos, POR OTRO LADO, MANEENJAN “CREENCIAS” (EN TÉRMINOS MATEMATICOS, «Дистрибуция») SOBRE LA Переменная Y Actureizan Sus Creencias Sobre La Variable A Medida Que Llega Nueva Información.
Веробабидад
Cuando Queremos Saber la probabilidad de un evento basado en la inuseencia de otro evento, expresamos esto como una Веробабидад кондейский Отказ ESTO SE Expresa de la Siguiente Manera:
- P = (E | F) Донс:
- Е El Evento Cuya Probabilidad En la Que Estamos Interesados.
- F es el evento que ya ocurrió.
Un jemplo podria ser expresar como una persona con un ritmo cardiaco sano tiene una probabilidad menor de morir en una una unidad de terapia intensiva durante una tissita hospitalaria:
P (Muerte en uti | Ritmo Cardiaco Analormal) > P (Muerte en uti | Ritmo Cardiaco Sano)
Algunas Veces, Escucharemos Que El Segundo Evento, F ES ReficiDo Como La Condición. La Probabilidad Condisional ES Interesante EN Artrendizaje Automático y Artuendizaje Profundo Pornque en algunas Situaciones Estaremos Interesados en Como Ocurren Multiples Edotots Y Como Estos Interactuan. NoS Interesa La Probabilidad Condisional El Artrendizaje Automático E EL Contexto EN Que Le enseñaríamos on Clasificador que
- P = (E | f) donde Е es nuestro objetivo y F es un número de atributos sobre la entidad para la que estamos prediciendo Е Отказ ООН EJEMPLO Podria Ser Predecir La Mortalidad (Aqui, E ) Dados Una Medidas Tomadas en una uti para cada paciente (Aqui, f ).
Теорема де Бэйс
Una de las Applicaciones Mas Comunes de la Resbabilidad Condisional El Teorema de Belees. EN EL CAMPO DE LA MEDICINA, SE HA VISTO USADO PARA CALKUSY la probabilidad de que un paciente que da positivo en Уна Preuba Para Una Enfermedad Esperifica en Realidad Tiene La Enfermedad.
SE Define La Formula de Bayes Para Dos Eventos, А и B , как и я:
Веробабидада задний
En La Estadística Bayesiana, SE LLAMA PROBALIDAD Споритет ООН Evento Aleatorio A a La Probabilidad Condisional Que Se Asigna Descues de Generar La Evidencia. La Distribución de la Probabilidad Possore EsperiDa Como La Distribución de la Resbabilidad de una cantidad desconocida condicionada por la evidencia recopilada ru ООН эксперимента “Tratada como una Переменная desconocida. Vemos Este Concepto En Acción Son Función de Activacación Softmax, EN Donde Valores Brutos de Entrada Son Convertidos Ru Vergabilidades Poreres.
Дистрибуция
La Distribución de la Resbabilidad Es Ena Escesififación de la Estructura Estocastica de Priiables Aleatorias. EN ESTADística, Confiamos ru Hacer Suposiciones Sobre Cómo SE Distribuyen Los Datos Para SACAR Выводит Sobre Los Datos. Queremos Una Fórmula Queifique Que Tan Fruecuentes Son Los Valores de Las Surstaciones En La Distribución Y Como Estos Valores PuEden Ser Tomados Por Puntos En La Distribución. Una Distribución Comun Es Conocida Como La Distribución Normal (También LomadaDa La Distribución Gaussiana , O La Curva de Campana ). Queremos ajustar el dataset con una distribución porque si el dataset asta razonablemente cerca a la distribución, podemos sacar выводит басадас en la distribución teorica sobre COMO Operamos Con Los Datos.
Clasificamos Distribuziones Como континус О дискретки Отказ Una Distribución Hatereta Tiene Datos Que Pueden Asumir Solo Ciertos Valores. EN UNA Distribución Continua, Los Datos PuEden Tener Custerquier Valor Doctro de un Rango. Un jemplo de distribución Continua Puede Ser La Distribución Normal. Un Ejemplo de Distribución Hatereta Puede Ser La Distribución Binomial.
La Distribución Нормальный NOS Premite Asumir Que Las Distributuciones Muestryes de Las Estadísticas (POR EJEMPLO, LA “Media Muestral”) SE Distribuye Normormente EN PORDICIONS ESCESIFICAS. La distribución normal, o Distribución Gaussiana Fue Nombrada Así en Honor Al Matemático Y Físico del Siglo XVIII Карл Гаусс. La Distribución Normal Es DistriDa Por Su Promedio Y Su Desviiación Estandar Y Tiene Generalmente La Misma Forma A Traves de Todas Sus Variaciones.
Notras Distributuciones News En Artrendizaje Automático Incomuyen A:
- Distribución Binomial
- Distribución Gaussiana Interpa
- Distribución Normal Logarítmica
La distribución de los datos de enciretaMiento en el entrendizaje automático ES Г Ваственник Para Compender Cómo Viportizar Los Datos Para Эль Моладо.
Теорема дель Ограниченный Центральный
Si El Tamaño Muestral Es Lo Sufcomemente Grande, La Distribución de la Muestra del Promedio Muestral SE Aproxima A La Distribución Normal. ESTO ES Cierto Pesar de la distribución de la población de donde las muestras fueron tomadas.
PASADOS RU ESTE HECHO, PodeMos Realizar Inferencias Estadísticas Usando Pruebas Basadas En La Aproximada Newordadad del Promedio. VEMOS QUE ESTO ES CIERTO SESENENDEDEDEDEE DE SI LA MUESTRA SE EXTREE DE UNA POBLACION QUE NO DE DISPRUSTUYRE.
EN Ciencias de la Computación, Vemos Que Esto Se США Cuanto un Algoritmo ExamseiDidamente Muestras de un Población no Normal. CuAndo Graficamos El Histograma de la población de muestra de los expressos de Una distribución Normal, PodeMos Ver Este Efecto En Acción.
Dado que la distribución de cola larga (como zipf, leyes de potencia y distribuduciones de pareto) es en escenario en el el una una población de alta frecuencia es seguida por una población de baja frecuencia que упрей Estas Distributuciones Fueron Descubiertas Por Benoit Mandelbrot En Los ’50s Y Luego Polorizadas Por El Escritor Chris Anderson En Su libro Длинный хвост: почему будущее бизнеса продает меньше Отказ
ООН EJEMPLO Sería Clazifififar Los Artículos Que Vende Un Minorista, Entre Los Cuales Algunos Artículos Son Excecionalmente популярны Y Vemos Una Gran Cantidad de Artículos únicos Contidades Relativamente Pequeñas Vendidas. ESTA Distribucion de Rango-Frecuencia (принципиальным доминированием до популярных услуг ») VECES FOREA VENDES DE PODER. Desde Esta Perspectiva, Podemos Geenarlos Como Distribuciones de Cola Larga.
VEMOS ESTAS Distribuciones De Cola Larga Meaneestadas RU:
- Daños de un terremoto
El Daño Es Peor A La Vez Que La Escala del Temblor Incrementa, ASI Que El Peor de Los Casos Casos Casos Cambia.
- Campos de Maiz
VECES VEMOS EVERYOS FUERA DEL REGINGRE Histórico, Mientras Que Nuestro Modelo Tiende Ajustarse A La Media.
- Prediciendo fatalyad luego de tissa ati.
PodeMos Tener Eventos Muy Fuera del Alcance de lo que a la uci que afecten la mortalidad.
ESTOS EJEMPLOS SON SON CONECTOR SLOSELAS DE CLASIFIFIFACION PARE LA MAYORYA DE LOS MODESOS ESTADYSTICOS CANTIDADES DE DESOS. Si El Evento Más Interesante Ocurre POR Fuera de la Cola de la Distribución y No TeneMos Selectado ESTO EN LOS DEES DE ENENTRENAMIRETO, NuESTRO MODEO PUEDE DAR RESTHERSADOS IMPOREDECILLS. ESTE EFECTO SE PUEDE MEJORAR EN MODESOS NO LINEALES COMO LAS REDES NEURONAS. STESTARIAMOS ESTA SITUACION COMO EL CASO ESCESSIAL DEL FLASSELA “EN LA MUESTRA/FUERA de Muestra”. Включаемая ООН Practicante ExperimentaDo Del Artrendizaje Automático Puede Sorprendere de lo Bien que ue desempeña de endero en una muestra de datos de eneenramiento Sesgada, Перо не Логра Генерализатор Bien en la población más grande de datos.
LAS Distribuciones de Cola Larga Tratan Con La Posibilidad Real de de que ocurran eventos que son cinco veces la desviacion estandar. Debemos Ser Servientes de obtener una sentación decente de los Eventos en nuestros deestos de eneenramiento para evitar el sobreajuste de los de eneenramiento.
Muestras против Población.
La Población de los datos es defiDa Como Todas Las Unidades que nos gustaria estudiar o Утилизар Como Modelo Para Nuestro Experiento. ООН EJEMPLO PUEDE SER DEASTIR Nuestra Población de Estudio Como “Todos Los Programadores en python en El Estado de Tennessee”.
Una muestra de los datos es en subconjunto de la población de los detos que esperamos Que представление Una Distribución Precisa de Los Distribución SESGO DE MUESTRA (POR EJEMPLO, SESGAR La Distribución de la Muestra en función de cómo muestreamos la población).
Métodos de Re-Muestreo
Эль загрузка Y LA Validación Cruzada (Перекрестная проверка) Сын DOS Métodos Comunes De Re-Muestreo Que Son Muy útiles Para El Artrendizaje Automático. EN EL Contexto del Artrendizaje Automático Con Bootstrapce, Estamos Extreendo Muestras Aleatorias de Otra Muestra Para Generar Una Nueva Muestra que Tenga Un Enteribilibio La Cantidad de Muestras Por Clase. ESTO ES úTIL CUANDO DESEAMOS MODELAR CONTRAUN CONCUNTO SOUCUNTO DE DECOS CLASES ALTEATESE.
La Validación Cruzada (También llamada Оценка De Rotacion ) Es Método Para Para Bevenar Cuan Bien Un Modelo Generaliza En Los Datos de Entrenamiento. EN Vaveleacion Cruzada Diversimos Los deos de eneenramiento en N número de divisiones y luego searamos estas porciones en grupos de eneenramiento y de prueba. Entrenamos Los Grupos De Entrenamiento Y Lugogo Evaluamos El Modelo En Los Grupos de Prueba. Luego, Rotamos Las Divisiones Entre Los Dos Grupos Todas Las Veces Que Podamos Hasta Agotar Todas Las Variaciones. Нет сена ООН Número Magico Para Esta Practica. También Es Comun Ver Una Porción Sealada Para Usar Como DETOS de Validación Durante El Entrenamiento.
Sesgo de Selección.
En El Sesgo de Selección estamos lidiando con un método de muestreo que no tiene una aleatorización Adecuada y Sesga la muestra de manera que no es stredativa de la población que nos gustaria modelar. Necesitamos Estar Atentos Al Sesgo de Selección Cuanto Re-Muestraeamos DataSets ASI Нет SE SESTA SESGO EN Nuestros Modelos Que Solo Van Отмена La Precisión deestro Modelo Para La Población Total De Los Datos.
Posibilidad.
CuAndo Discutimos La Posibilidad de que ocurra Un Evento Pero Нет Hacemos Referencia Específica A SU Probabilidad Numérica, Estamos Usando El Término Informal, Позибилидад Отказ Normormente, Cuando Usamos Este Término, Estamos Hablando de Un Evento que Tiene Una Restabilidad De Ocurrir, Pero Aun Así Podría Нет OURIR. También PueDen Галерея Факторины Que No Fueron Surveados que PuEden Perficenciar El El Evento. Информация Posibilidad Es Usado También Como Sinónimo de Probabilidad.
Traduccion del libro: Джош Патерсон и Адам Гибсон. (2017). Глубокое обучение: Подход практикующего Отказ США: О’Рейли.
Оригинал: “https://dev.to/ruizleandro/matematicas-para-machine-learning-2lh9”