1*61e85e36SJonas Bonn /* 2*61e85e36SJonas Bonn * OpenRISC fault.c 3*61e85e36SJonas Bonn * 4*61e85e36SJonas Bonn * Linux architectural port borrowing liberally from similar works of 5*61e85e36SJonas Bonn * others. All original copyrights apply as per the original source 6*61e85e36SJonas Bonn * declaration. 7*61e85e36SJonas Bonn * 8*61e85e36SJonas Bonn * Modifications for the OpenRISC architecture: 9*61e85e36SJonas Bonn * Copyright (C) 2003 Matjaz Breskvar <phoenix@bsemi.com> 10*61e85e36SJonas Bonn * Copyright (C) 2010-2011 Jonas Bonn <jonas@southpole.se> 11*61e85e36SJonas Bonn * 12*61e85e36SJonas Bonn * This program is free software; you can redistribute it and/or 13*61e85e36SJonas Bonn * modify it under the terms of the GNU General Public License 14*61e85e36SJonas Bonn * as published by the Free Software Foundation; either version 15*61e85e36SJonas Bonn * 2 of the License, or (at your option) any later version. 16*61e85e36SJonas Bonn */ 17*61e85e36SJonas Bonn 18*61e85e36SJonas Bonn #include <linux/mm.h> 19*61e85e36SJonas Bonn #include <linux/interrupt.h> 20*61e85e36SJonas Bonn #include <linux/module.h> 21*61e85e36SJonas Bonn #include <linux/sched.h> 22*61e85e36SJonas Bonn 23*61e85e36SJonas Bonn #include <asm/uaccess.h> 24*61e85e36SJonas Bonn #include <asm/siginfo.h> 25*61e85e36SJonas Bonn #include <asm/signal.h> 26*61e85e36SJonas Bonn 27*61e85e36SJonas Bonn #define NUM_TLB_ENTRIES 64 28*61e85e36SJonas Bonn #define TLB_OFFSET(add) (((add) >> PAGE_SHIFT) & (NUM_TLB_ENTRIES-1)) 29*61e85e36SJonas Bonn 30*61e85e36SJonas Bonn unsigned long pte_misses; /* updated by do_page_fault() */ 31*61e85e36SJonas Bonn unsigned long pte_errors; /* updated by do_page_fault() */ 32*61e85e36SJonas Bonn 33*61e85e36SJonas Bonn /* __PHX__ :: - check the vmalloc_fault in do_page_fault() 34*61e85e36SJonas Bonn * - also look into include/asm-or32/mmu_context.h 35*61e85e36SJonas Bonn */ 36*61e85e36SJonas Bonn volatile pgd_t *current_pgd; 37*61e85e36SJonas Bonn 38*61e85e36SJonas Bonn extern void die(char *, struct pt_regs *, long); 39*61e85e36SJonas Bonn 40*61e85e36SJonas Bonn /* 41*61e85e36SJonas Bonn * This routine handles page faults. It determines the address, 42*61e85e36SJonas Bonn * and the problem, and then passes it off to one of the appropriate 43*61e85e36SJonas Bonn * routines. 44*61e85e36SJonas Bonn * 45*61e85e36SJonas Bonn * If this routine detects a bad access, it returns 1, otherwise it 46*61e85e36SJonas Bonn * returns 0. 47*61e85e36SJonas Bonn */ 48*61e85e36SJonas Bonn 49*61e85e36SJonas Bonn asmlinkage void do_page_fault(struct pt_regs *regs, unsigned long address, 50*61e85e36SJonas Bonn unsigned long vector, int write_acc) 51*61e85e36SJonas Bonn { 52*61e85e36SJonas Bonn struct task_struct *tsk; 53*61e85e36SJonas Bonn struct mm_struct *mm; 54*61e85e36SJonas Bonn struct vm_area_struct *vma; 55*61e85e36SJonas Bonn siginfo_t info; 56*61e85e36SJonas Bonn int fault; 57*61e85e36SJonas Bonn 58*61e85e36SJonas Bonn tsk = current; 59*61e85e36SJonas Bonn 60*61e85e36SJonas Bonn /* 61*61e85e36SJonas Bonn * We fault-in kernel-space virtual memory on-demand. The 62*61e85e36SJonas Bonn * 'reference' page table is init_mm.pgd. 63*61e85e36SJonas Bonn * 64*61e85e36SJonas Bonn * NOTE! We MUST NOT take any locks for this case. We may 65*61e85e36SJonas Bonn * be in an interrupt or a critical region, and should 66*61e85e36SJonas Bonn * only copy the information from the master page table, 67*61e85e36SJonas Bonn * nothing more. 68*61e85e36SJonas Bonn * 69*61e85e36SJonas Bonn * NOTE2: This is done so that, when updating the vmalloc 70*61e85e36SJonas Bonn * mappings we don't have to walk all processes pgdirs and 71*61e85e36SJonas Bonn * add the high mappings all at once. Instead we do it as they 72*61e85e36SJonas Bonn * are used. However vmalloc'ed page entries have the PAGE_GLOBAL 73*61e85e36SJonas Bonn * bit set so sometimes the TLB can use a lingering entry. 74*61e85e36SJonas Bonn * 75*61e85e36SJonas Bonn * This verifies that the fault happens in kernel space 76*61e85e36SJonas Bonn * and that the fault was not a protection error. 77*61e85e36SJonas Bonn */ 78*61e85e36SJonas Bonn 79*61e85e36SJonas Bonn if (address >= VMALLOC_START && 80*61e85e36SJonas Bonn (vector != 0x300 && vector != 0x400) && 81*61e85e36SJonas Bonn !user_mode(regs)) 82*61e85e36SJonas Bonn goto vmalloc_fault; 83*61e85e36SJonas Bonn 84*61e85e36SJonas Bonn /* If exceptions were enabled, we can reenable them here */ 85*61e85e36SJonas Bonn if (user_mode(regs)) { 86*61e85e36SJonas Bonn /* Exception was in userspace: reenable interrupts */ 87*61e85e36SJonas Bonn local_irq_enable(); 88*61e85e36SJonas Bonn } else { 89*61e85e36SJonas Bonn /* If exception was in a syscall, then IRQ's may have 90*61e85e36SJonas Bonn * been enabled or disabled. If they were enabled, 91*61e85e36SJonas Bonn * reenable them. 92*61e85e36SJonas Bonn */ 93*61e85e36SJonas Bonn if (regs->sr && (SPR_SR_IEE | SPR_SR_TEE)) 94*61e85e36SJonas Bonn local_irq_enable(); 95*61e85e36SJonas Bonn } 96*61e85e36SJonas Bonn 97*61e85e36SJonas Bonn mm = tsk->mm; 98*61e85e36SJonas Bonn info.si_code = SEGV_MAPERR; 99*61e85e36SJonas Bonn 100*61e85e36SJonas Bonn /* 101*61e85e36SJonas Bonn * If we're in an interrupt or have no user 102*61e85e36SJonas Bonn * context, we must not take the fault.. 103*61e85e36SJonas Bonn */ 104*61e85e36SJonas Bonn 105*61e85e36SJonas Bonn if (in_interrupt() || !mm) 106*61e85e36SJonas Bonn goto no_context; 107*61e85e36SJonas Bonn 108*61e85e36SJonas Bonn down_read(&mm->mmap_sem); 109*61e85e36SJonas Bonn vma = find_vma(mm, address); 110*61e85e36SJonas Bonn 111*61e85e36SJonas Bonn if (!vma) 112*61e85e36SJonas Bonn goto bad_area; 113*61e85e36SJonas Bonn 114*61e85e36SJonas Bonn if (vma->vm_start <= address) 115*61e85e36SJonas Bonn goto good_area; 116*61e85e36SJonas Bonn 117*61e85e36SJonas Bonn if (!(vma->vm_flags & VM_GROWSDOWN)) 118*61e85e36SJonas Bonn goto bad_area; 119*61e85e36SJonas Bonn 120*61e85e36SJonas Bonn if (user_mode(regs)) { 121*61e85e36SJonas Bonn /* 122*61e85e36SJonas Bonn * accessing the stack below usp is always a bug. 123*61e85e36SJonas Bonn * we get page-aligned addresses so we can only check 124*61e85e36SJonas Bonn * if we're within a page from usp, but that might be 125*61e85e36SJonas Bonn * enough to catch brutal errors at least. 126*61e85e36SJonas Bonn */ 127*61e85e36SJonas Bonn if (address + PAGE_SIZE < regs->sp) 128*61e85e36SJonas Bonn goto bad_area; 129*61e85e36SJonas Bonn } 130*61e85e36SJonas Bonn if (expand_stack(vma, address)) 131*61e85e36SJonas Bonn goto bad_area; 132*61e85e36SJonas Bonn 133*61e85e36SJonas Bonn /* 134*61e85e36SJonas Bonn * Ok, we have a good vm_area for this memory access, so 135*61e85e36SJonas Bonn * we can handle it.. 136*61e85e36SJonas Bonn */ 137*61e85e36SJonas Bonn 138*61e85e36SJonas Bonn good_area: 139*61e85e36SJonas Bonn info.si_code = SEGV_ACCERR; 140*61e85e36SJonas Bonn 141*61e85e36SJonas Bonn /* first do some preliminary protection checks */ 142*61e85e36SJonas Bonn 143*61e85e36SJonas Bonn if (write_acc) { 144*61e85e36SJonas Bonn if (!(vma->vm_flags & VM_WRITE)) 145*61e85e36SJonas Bonn goto bad_area; 146*61e85e36SJonas Bonn } else { 147*61e85e36SJonas Bonn /* not present */ 148*61e85e36SJonas Bonn if (!(vma->vm_flags & (VM_READ | VM_EXEC))) 149*61e85e36SJonas Bonn goto bad_area; 150*61e85e36SJonas Bonn } 151*61e85e36SJonas Bonn 152*61e85e36SJonas Bonn /* are we trying to execute nonexecutable area */ 153*61e85e36SJonas Bonn if ((vector == 0x400) && !(vma->vm_page_prot.pgprot & _PAGE_EXEC)) 154*61e85e36SJonas Bonn goto bad_area; 155*61e85e36SJonas Bonn 156*61e85e36SJonas Bonn /* 157*61e85e36SJonas Bonn * If for any reason at all we couldn't handle the fault, 158*61e85e36SJonas Bonn * make sure we exit gracefully rather than endlessly redo 159*61e85e36SJonas Bonn * the fault. 160*61e85e36SJonas Bonn */ 161*61e85e36SJonas Bonn 162*61e85e36SJonas Bonn fault = handle_mm_fault(mm, vma, address, write_acc); 163*61e85e36SJonas Bonn if (unlikely(fault & VM_FAULT_ERROR)) { 164*61e85e36SJonas Bonn if (fault & VM_FAULT_OOM) 165*61e85e36SJonas Bonn goto out_of_memory; 166*61e85e36SJonas Bonn else if (fault & VM_FAULT_SIGBUS) 167*61e85e36SJonas Bonn goto do_sigbus; 168*61e85e36SJonas Bonn BUG(); 169*61e85e36SJonas Bonn } 170*61e85e36SJonas Bonn /*RGD modeled on Cris */ 171*61e85e36SJonas Bonn if (fault & VM_FAULT_MAJOR) 172*61e85e36SJonas Bonn tsk->maj_flt++; 173*61e85e36SJonas Bonn else 174*61e85e36SJonas Bonn tsk->min_flt++; 175*61e85e36SJonas Bonn 176*61e85e36SJonas Bonn up_read(&mm->mmap_sem); 177*61e85e36SJonas Bonn return; 178*61e85e36SJonas Bonn 179*61e85e36SJonas Bonn /* 180*61e85e36SJonas Bonn * Something tried to access memory that isn't in our memory map.. 181*61e85e36SJonas Bonn * Fix it, but check if it's kernel or user first.. 182*61e85e36SJonas Bonn */ 183*61e85e36SJonas Bonn 184*61e85e36SJonas Bonn bad_area: 185*61e85e36SJonas Bonn up_read(&mm->mmap_sem); 186*61e85e36SJonas Bonn 187*61e85e36SJonas Bonn bad_area_nosemaphore: 188*61e85e36SJonas Bonn 189*61e85e36SJonas Bonn /* User mode accesses just cause a SIGSEGV */ 190*61e85e36SJonas Bonn 191*61e85e36SJonas Bonn if (user_mode(regs)) { 192*61e85e36SJonas Bonn info.si_signo = SIGSEGV; 193*61e85e36SJonas Bonn info.si_errno = 0; 194*61e85e36SJonas Bonn /* info.si_code has been set above */ 195*61e85e36SJonas Bonn info.si_addr = (void *)address; 196*61e85e36SJonas Bonn force_sig_info(SIGSEGV, &info, tsk); 197*61e85e36SJonas Bonn return; 198*61e85e36SJonas Bonn } 199*61e85e36SJonas Bonn 200*61e85e36SJonas Bonn no_context: 201*61e85e36SJonas Bonn 202*61e85e36SJonas Bonn /* Are we prepared to handle this kernel fault? 203*61e85e36SJonas Bonn * 204*61e85e36SJonas Bonn * (The kernel has valid exception-points in the source 205*61e85e36SJonas Bonn * when it acesses user-memory. When it fails in one 206*61e85e36SJonas Bonn * of those points, we find it in a table and do a jump 207*61e85e36SJonas Bonn * to some fixup code that loads an appropriate error 208*61e85e36SJonas Bonn * code) 209*61e85e36SJonas Bonn */ 210*61e85e36SJonas Bonn 211*61e85e36SJonas Bonn { 212*61e85e36SJonas Bonn const struct exception_table_entry *entry; 213*61e85e36SJonas Bonn 214*61e85e36SJonas Bonn __asm__ __volatile__("l.nop 42"); 215*61e85e36SJonas Bonn 216*61e85e36SJonas Bonn if ((entry = search_exception_tables(regs->pc)) != NULL) { 217*61e85e36SJonas Bonn /* Adjust the instruction pointer in the stackframe */ 218*61e85e36SJonas Bonn regs->pc = entry->fixup; 219*61e85e36SJonas Bonn return; 220*61e85e36SJonas Bonn } 221*61e85e36SJonas Bonn } 222*61e85e36SJonas Bonn 223*61e85e36SJonas Bonn /* 224*61e85e36SJonas Bonn * Oops. The kernel tried to access some bad page. We'll have to 225*61e85e36SJonas Bonn * terminate things with extreme prejudice. 226*61e85e36SJonas Bonn */ 227*61e85e36SJonas Bonn 228*61e85e36SJonas Bonn if ((unsigned long)(address) < PAGE_SIZE) 229*61e85e36SJonas Bonn printk(KERN_ALERT 230*61e85e36SJonas Bonn "Unable to handle kernel NULL pointer dereference"); 231*61e85e36SJonas Bonn else 232*61e85e36SJonas Bonn printk(KERN_ALERT "Unable to handle kernel access"); 233*61e85e36SJonas Bonn printk(" at virtual address 0x%08lx\n", address); 234*61e85e36SJonas Bonn 235*61e85e36SJonas Bonn die("Oops", regs, write_acc); 236*61e85e36SJonas Bonn 237*61e85e36SJonas Bonn do_exit(SIGKILL); 238*61e85e36SJonas Bonn 239*61e85e36SJonas Bonn /* 240*61e85e36SJonas Bonn * We ran out of memory, or some other thing happened to us that made 241*61e85e36SJonas Bonn * us unable to handle the page fault gracefully. 242*61e85e36SJonas Bonn */ 243*61e85e36SJonas Bonn 244*61e85e36SJonas Bonn out_of_memory: 245*61e85e36SJonas Bonn __asm__ __volatile__("l.nop 42"); 246*61e85e36SJonas Bonn __asm__ __volatile__("l.nop 1"); 247*61e85e36SJonas Bonn 248*61e85e36SJonas Bonn up_read(&mm->mmap_sem); 249*61e85e36SJonas Bonn printk("VM: killing process %s\n", tsk->comm); 250*61e85e36SJonas Bonn if (user_mode(regs)) 251*61e85e36SJonas Bonn do_exit(SIGKILL); 252*61e85e36SJonas Bonn goto no_context; 253*61e85e36SJonas Bonn 254*61e85e36SJonas Bonn do_sigbus: 255*61e85e36SJonas Bonn up_read(&mm->mmap_sem); 256*61e85e36SJonas Bonn 257*61e85e36SJonas Bonn /* 258*61e85e36SJonas Bonn * Send a sigbus, regardless of whether we were in kernel 259*61e85e36SJonas Bonn * or user mode. 260*61e85e36SJonas Bonn */ 261*61e85e36SJonas Bonn info.si_signo = SIGBUS; 262*61e85e36SJonas Bonn info.si_errno = 0; 263*61e85e36SJonas Bonn info.si_code = BUS_ADRERR; 264*61e85e36SJonas Bonn info.si_addr = (void *)address; 265*61e85e36SJonas Bonn force_sig_info(SIGBUS, &info, tsk); 266*61e85e36SJonas Bonn 267*61e85e36SJonas Bonn /* Kernel mode? Handle exceptions or die */ 268*61e85e36SJonas Bonn if (!user_mode(regs)) 269*61e85e36SJonas Bonn goto no_context; 270*61e85e36SJonas Bonn return; 271*61e85e36SJonas Bonn 272*61e85e36SJonas Bonn vmalloc_fault: 273*61e85e36SJonas Bonn { 274*61e85e36SJonas Bonn /* 275*61e85e36SJonas Bonn * Synchronize this task's top level page-table 276*61e85e36SJonas Bonn * with the 'reference' page table. 277*61e85e36SJonas Bonn * 278*61e85e36SJonas Bonn * Use current_pgd instead of tsk->active_mm->pgd 279*61e85e36SJonas Bonn * since the latter might be unavailable if this 280*61e85e36SJonas Bonn * code is executed in a misfortunately run irq 281*61e85e36SJonas Bonn * (like inside schedule() between switch_mm and 282*61e85e36SJonas Bonn * switch_to...). 283*61e85e36SJonas Bonn */ 284*61e85e36SJonas Bonn 285*61e85e36SJonas Bonn int offset = pgd_index(address); 286*61e85e36SJonas Bonn pgd_t *pgd, *pgd_k; 287*61e85e36SJonas Bonn pud_t *pud, *pud_k; 288*61e85e36SJonas Bonn pmd_t *pmd, *pmd_k; 289*61e85e36SJonas Bonn pte_t *pte_k; 290*61e85e36SJonas Bonn 291*61e85e36SJonas Bonn /* 292*61e85e36SJonas Bonn phx_warn("do_page_fault(): vmalloc_fault will not work, " 293*61e85e36SJonas Bonn "since current_pgd assign a proper value somewhere\n" 294*61e85e36SJonas Bonn "anyhow we don't need this at the moment\n"); 295*61e85e36SJonas Bonn 296*61e85e36SJonas Bonn phx_mmu("vmalloc_fault"); 297*61e85e36SJonas Bonn */ 298*61e85e36SJonas Bonn pgd = (pgd_t *)current_pgd + offset; 299*61e85e36SJonas Bonn pgd_k = init_mm.pgd + offset; 300*61e85e36SJonas Bonn 301*61e85e36SJonas Bonn /* Since we're two-level, we don't need to do both 302*61e85e36SJonas Bonn * set_pgd and set_pmd (they do the same thing). If 303*61e85e36SJonas Bonn * we go three-level at some point, do the right thing 304*61e85e36SJonas Bonn * with pgd_present and set_pgd here. 305*61e85e36SJonas Bonn * 306*61e85e36SJonas Bonn * Also, since the vmalloc area is global, we don't 307*61e85e36SJonas Bonn * need to copy individual PTE's, it is enough to 308*61e85e36SJonas Bonn * copy the pgd pointer into the pte page of the 309*61e85e36SJonas Bonn * root task. If that is there, we'll find our pte if 310*61e85e36SJonas Bonn * it exists. 311*61e85e36SJonas Bonn */ 312*61e85e36SJonas Bonn 313*61e85e36SJonas Bonn pud = pud_offset(pgd, address); 314*61e85e36SJonas Bonn pud_k = pud_offset(pgd_k, address); 315*61e85e36SJonas Bonn if (!pud_present(*pud_k)) 316*61e85e36SJonas Bonn goto no_context; 317*61e85e36SJonas Bonn 318*61e85e36SJonas Bonn pmd = pmd_offset(pud, address); 319*61e85e36SJonas Bonn pmd_k = pmd_offset(pud_k, address); 320*61e85e36SJonas Bonn 321*61e85e36SJonas Bonn if (!pmd_present(*pmd_k)) 322*61e85e36SJonas Bonn goto bad_area_nosemaphore; 323*61e85e36SJonas Bonn 324*61e85e36SJonas Bonn set_pmd(pmd, *pmd_k); 325*61e85e36SJonas Bonn 326*61e85e36SJonas Bonn /* Make sure the actual PTE exists as well to 327*61e85e36SJonas Bonn * catch kernel vmalloc-area accesses to non-mapped 328*61e85e36SJonas Bonn * addresses. If we don't do this, this will just 329*61e85e36SJonas Bonn * silently loop forever. 330*61e85e36SJonas Bonn */ 331*61e85e36SJonas Bonn 332*61e85e36SJonas Bonn pte_k = pte_offset_kernel(pmd_k, address); 333*61e85e36SJonas Bonn if (!pte_present(*pte_k)) 334*61e85e36SJonas Bonn goto no_context; 335*61e85e36SJonas Bonn 336*61e85e36SJonas Bonn return; 337*61e85e36SJonas Bonn } 338*61e85e36SJonas Bonn } 339