Se refiere a la indecisión o la duda de las actividades que uno realiza. Esta proviene de la falta o escasez de conocimientos
El grado de creencia de los agentes puede proporcionar solo uno. El cual puede ser solo 0 y 1.
La probabilidad priori proporciona los posibles resultados antes de efectuar el experimento, el cual puede tomar valores de falso o verdadero según sea el caso.
Los problemas de decisión secuencial, donde el agente depende de una secuencia de decisiones, este tipo de problemas implican utilidades, incertidumbre y percepción que constituyen una generalización de los problemas de búsqueda y planificación.
El agente debe comprometerse con toda una secuencia de acciones antes de ejecutarlas. Tiene la oportunidad de escoger una nueva acción, en cuanto concluye un paso, con base en la información adicional que le proporcionan sus sensores.
En los ambientes inaccesibles. La percepción del agente en cada paso le permitirá identificar cual es el estado en que se encuentra. La capacidad para calcular la acción óptima para cada uno de los estados definirá totalmente su conducta.
El agente debe tomar en cuenta la información que pueda obtener, así como el estado al que llegará. La manera común de resolver PDMPO consiste en construir un nuevo PDM en el que esa distribución de probabilidad desempeñe el papel de variable de estado. En vez de esforzarse por hallar soluciones exactas, se puede lograr una buena aproximación mediante una previsión limitada.